Anysite 将公开网络转化为结构化数据。无需自己编写爬虫、对抗反爬系统,只需调用一个 API 即可获得干净的 JSON — 无论你需要的是 LinkedIn 个人资料、公司的官方备案、产品评价,还是 YouTube 视频下的评论。 本页用通俗语言带你了解每个数据源到底能做什么。具体参数和响应结构,每个部分都链接到完整的 API 参考。Documentation Index
Fetch the complete documentation index at: https://docs.anysite.io/llms.txt
Use this file to discover all available pages before exploring further.
39 个数据源
社交、专业、金融、商业和官方注册登记数据
180+ 个端点
开箱即用的方法 — 无需爬虫、代理或维护
一次集成
REST API、MCP 服务器、CLI 或 n8n — 数据处处一致
专业与社交网络
Anysite 的核心。覆盖各大平台的人、公司、内容与互动数据。LinkedIn 端点
个人资料、公司、帖子、搜索、Sales Navigator 和邮箱查找
Twitter / X
4 个端点,用于实时社交聆听。获取用户资料和完整时间线,并按关键词搜索帖子和账号 — 非常适合监控对话、舆情和竞争对手。TikTok
5 个端点,用于短视频洞察。获取用户资料及其视频,拉取任意单条视频及其评论,并按关键词搜索视频以发现趋势和爆款内容。YouTube
14 个端点 — 最完整的视频数据源。浏览频道的视频、Shorts、直播、播放列表和社区帖子。打开任意视频获取详情、评论和完整字幕/文字稿(非常适合喂给 LLM)。直接搜索频道、播放列表和视频。初创公司、企业与官方注册登记
从早期初创公司到上市公司备案 — 经过核实的结构化企业数据。Y Combinator
3 个端点,用于初创公司情报。获取 YC 公司资料,并跨所有批次搜索公司和创始人 — 适用于 VC 寻源、竞争图谱和顶级初创公司招聘。Crunchbase
3 个端点,用于融资和投资人数据。获取公司资料或搜索 Crunchbase 数据库,了解融资轮次、投资人和增长信号。Product Hunt
23 个端点 — 完整的 Product Hunt 生态。追踪产品(详情、搜索、评价、替代品、客户、发布历史)、每日发布及其评论、排行榜、合集、话题、分类和讨论论坛。深入分析创客和用户的发布、点赞、合集、评论和技术栈。产品研究和趋势发现的宝库。Companies House(英国)
8 个端点,直接来自英国官方公司注册处。查询公司资料、备案历史、抵押登记、高管和重要控制人(实益拥有人)。按名称搜索公司和高管。权威、可作法律依据的数据。OpenCorporates
2 个端点,用于全球企业查询。在全球最大的开放公司记录数据库中查找公司资料或搜索。SEC(美国)
2 个端点,用于美国上市公司研究。搜索公司并获取其 SEC 备案文件 — 10-K、8-K 等 — 用于财务和尽职调查工作。GitHub
3 个端点,用于开发者和技术情报。查询代码仓库、搜索仓库和搜索用户 — 适用于技术招聘和开源生态分析。搜索与网络
当你需要开放网络时 — 搜索引擎、地图,以及面向其他一切的通用解析器。Yahoo
7 个端点,结合通用搜索引擎和金融数据。搜索网页、新闻、图片和视频 — 外加 Yahoo Finance 提供股票报价、历史价格数据和代码搜索。DuckDuckGo
1 个端点,提供注重隐私的网络搜索结果 — 当你只需要链接和摘要时,一个干净、无追踪的替代方案。网页解析器(Web Parser)
2 个端点,让任何网站成为数据源。将解析器指向某个 URL 即可获得结构化内容,或拉取站点的完整 sitemap 以发现每个页面。当没有专用数据源时,这是通用的兜底方案。通用抓取
网页解析器把任意页面转化为结构化 JSON
电商平台与产品评价
电商商品、卖家和软件评价平台。Amazon
5 个端点,用于商品和卖家研究。获取商品详情和报价、搜索商品,并查询卖家及其商品目录 — 用于价格情报、最低限价(MAP)监控和市场分析。Mercari
2 个端点,面向日本二手交易平台 — 商品详情和商品搜索。Capterra
3 个端点,面向软件采购方。获取产品详情及其评价,并搜索 Capterra 目录 — SaaS 的竞争情报。G2
1 个端点,搜索 G2 软件产品目录 — 与 Capterra 互补的评价站信号。行业与垂直数据源(AI 智能爬虫)
除了主流平台,Anysite 还内置了面向特定网站的专用解析器 — 合作伙伴目录、垂直招聘网站、注册登记库和出版商。例如西门子和霍尼韦尔合作伙伴网络、罗克韦尔自动化合作伙伴、Wasabi 渠道合作伙伴、GLEIF LEI 注册库、BuiltWith 技术数据、ApplyBoard 院校项目、JustJoinIT 职位列表,以及若干垂直出版商。 重点不在于这份清单 — 而在于这种模式:任何网站都能成为干净、结构化的端点。 如果你需要的数据源尚未提供,它可以被构建出来,并自动出现在 API、MCP 服务器和 CLI 中。自定义端点
为任意网站申请解析器 — 它会自动出现在每一种集成中
如何访问这些数据源
以上每个数据源都可通过 Anysite 的四种集成方式访问 — 同样的数据,任你选择接口:REST API
使用
access-token 请求头直接发起 HTTP 调用MCP 服务器
让 AI 代理发现并调用任意端点
Anysite CLI
批处理、流水线和数据库加载
n8n 节点
无代码工作流自动化