跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.anysite.io/llms.txt

Use this file to discover all available pages before exploring further.

Anysite 将公开网络转化为结构化数据。无需自己编写爬虫、对抗反爬系统,只需调用一个 API 即可获得干净的 JSON — 无论你需要的是 LinkedIn 个人资料、公司的官方备案、产品评价,还是 YouTube 视频下的评论。 本页用通俗语言带你了解每个数据源到底能做什么。具体参数和响应结构,每个部分都链接到完整的 API 参考

39 个数据源

社交、专业、金融、商业和官方注册登记数据

180+ 个端点

开箱即用的方法 — 无需爬虫、代理或维护

一次集成

REST API、MCP 服务器、CLI 或 n8n — 数据处处一致

专业与社交网络

Anysite 的核心。覆盖各大平台的人、公司、内容与互动数据。

LinkedIn

我们最深入的数据源 — 35 个端点,覆盖人、公司和内容。这是销售开发、招聘和 B2B 研究的支柱。 人。 通过 URL 或姓名获取完整个人资料(工作经历、教育背景、技能、证书、荣誉、专利、语言)。进一步还可获取此人的帖子、评论、点赞,以及为其技能背书的人。 公司。 获取公司资料、员工人数与统计、真实员工列表,以及公司发布的全部内容。 搜索。 通过丰富的筛选条件查找人、公司、职位和帖子 — 还有行业、地区、学校的辅助查询以构建精准条件。包含 Sales Navigator 级别的人员搜索。 邮箱查找。 从个人资料或 LinkedIn URL 中发现并验证对方的工作邮箱 — 非常适合外联场景的数据增强。

LinkedIn 端点

个人资料、公司、帖子、搜索、Sales Navigator 和邮箱查找

Instagram

8 个端点,用于创作者和品牌洞察。获取用户资料、帖子和 Reels,以及粉丝/关注列表。深入任意单条帖子,读取其评论并查看点赞者。按关键词或话题标签搜索帖子,追踪活动和趋势。

Twitter / X

4 个端点,用于实时社交聆听。获取用户资料和完整时间线,并按关键词搜索帖子和账号 — 非常适合监控对话、舆情和竞争对手。

Reddit

11 个端点,用于社区与舆情研究。读取帖子及其评论树,分析任意用户(其帖子和评论),并浏览 subreddit — 包括热门 subreddit 及其完整动态。在帖子、subreddit 和用户中搜索,精准定位你关心的讨论。

TikTok

5 个端点,用于短视频洞察。获取用户资料及其视频,拉取任意单条视频及其评论,并按关键词搜索视频以发现趋势和爆款内容。

YouTube

14 个端点 — 最完整的视频数据源。浏览频道的视频、Shorts、直播、播放列表和社区帖子。打开任意视频获取详情、评论和完整字幕/文字稿(非常适合喂给 LLM)。直接搜索频道、播放列表和视频。

Facebook

5 个端点,聚焦广告库(Ad Library) — 完整的广告透明度数据。查询广告主、浏览其正在投放的广告,并按关键词搜索广告或广告主。监控竞争对手广告和创意策略的最快方式。

初创公司、企业与官方注册登记

从早期初创公司到上市公司备案 — 经过核实的结构化企业数据。

Y Combinator

3 个端点,用于初创公司情报。获取 YC 公司资料,并跨所有批次搜索公司和创始人 — 适用于 VC 寻源、竞争图谱和顶级初创公司招聘。

Crunchbase

3 个端点,用于融资和投资人数据。获取公司资料或搜索 Crunchbase 数据库,了解融资轮次、投资人和增长信号。

Product Hunt

23 个端点 — 完整的 Product Hunt 生态。追踪产品(详情、搜索、评价、替代品、客户、发布历史)、每日发布及其评论、排行榜、合集、话题、分类和讨论论坛。深入分析创客和用户的发布、点赞、合集、评论和技术栈。产品研究和趋势发现的宝库。

Companies House(英国)

8 个端点,直接来自英国官方公司注册处。查询公司资料、备案历史、抵押登记、高管和重要控制人(实益拥有人)。按名称搜索公司和高管。权威、可作法律依据的数据。

OpenCorporates

2 个端点,用于全球企业查询。在全球最大的开放公司记录数据库中查找公司资料或搜索。

SEC(美国)

2 个端点,用于美国上市公司研究。搜索公司并获取其 SEC 备案文件 — 10-K、8-K 等 — 用于财务和尽职调查工作。

GitHub

3 个端点,用于开发者和技术情报。查询代码仓库、搜索仓库和搜索用户 — 适用于技术招聘和开源生态分析。

搜索与网络

当你需要开放网络时 — 搜索引擎、地图,以及面向其他一切的通用解析器。

Google

10 个端点,分为两大领域。地图: 查找地点、搜索地点,读取其照片、评价和评价者资料 — 大规模的本地商家和声誉数据。广告透明度: 查询广告主及其投放的广告,用于竞争性广告研究。

Yahoo

7 个端点,结合通用搜索引擎和金融数据。搜索网页、新闻、图片和视频 — 外加 Yahoo Finance 提供股票报价、历史价格数据和代码搜索。

DuckDuckGo

1 个端点,提供注重隐私的网络搜索结果 — 当你只需要链接和摘要时,一个干净、无追踪的替代方案。

网页解析器(Web Parser)

2 个端点,让任何网站成为数据源。将解析器指向某个 URL 即可获得结构化内容,或拉取站点的完整 sitemap 以发现每个页面。当没有专用数据源时,这是通用的兜底方案。

通用抓取

网页解析器把任意页面转化为结构化 JSON

电商平台与产品评价

电商商品、卖家和软件评价平台。

Amazon

5 个端点,用于商品和卖家研究。获取商品详情和报价、搜索商品,并查询卖家及其商品目录 — 用于价格情报、最低限价(MAP)监控和市场分析。

Mercari

2 个端点,面向日本二手交易平台 — 商品详情和商品搜索。

Capterra

3 个端点,面向软件采购方。获取产品详情及其评价,并搜索 Capterra 目录 — SaaS 的竞争情报。

G2

1 个端点,搜索 G2 软件产品目录 — 与 Capterra 互补的评价站信号。

行业与垂直数据源(AI 智能爬虫)

除了主流平台,Anysite 还内置了面向特定网站的专用解析器 — 合作伙伴目录、垂直招聘网站、注册登记库和出版商。例如西门子和霍尼韦尔合作伙伴网络、罗克韦尔自动化合作伙伴、Wasabi 渠道合作伙伴、GLEIF LEI 注册库、BuiltWith 技术数据、ApplyBoard 院校项目、JustJoinIT 职位列表,以及若干垂直出版商。 重点不在于这份清单 — 而在于这种模式:任何网站都能成为干净、结构化的端点。 如果你需要的数据源尚未提供,它可以被构建出来,并自动出现在 API、MCP 服务器和 CLI 中。

自定义端点

为任意网站申请解析器 — 它会自动出现在每一种集成中

如何访问这些数据源

以上每个数据源都可通过 Anysite 的四种集成方式访问 — 同样的数据,任你选择接口:

REST API

使用 access-token 请求头直接发起 HTTP 调用

MCP 服务器

让 AI 代理发现并调用任意端点

Anysite CLI

批处理、流水线和数据库加载

n8n 节点

无代码工作流自动化