mcp/apify-mcp-serverApify是全球最大的Web抓取、数据提取和Web自动化工具市场。您可以从社交媒体、电子商务、搜索引擎、地图、旅游网站或任何其他网站提取结构化数据。
什么是MCP Server?
| 属性 | 详情 |
|---|---|
| Docker镜像 | mcp/apify-mcp-server |
| 作者 | apify |
| 仓库 | [***] |
| 属性 | 详情 |
|---|---|
| Dockerfile | [***] |
| Docker镜像构建者 | Docker Inc. |
| Docker Scout健康评分 | !Docker Scout Health Score |
| 验证签名 | COSIGN_REPOSITORY=mcp/signatures cosign verify mcp/apify-mcp-server --key [***] |
| 许可证 | MIT许可证 |
| 服务器提供的工具 | 简短描述 |
|---|---|
apify-slash-rag-web-browser | 调用Actor "apify/rag-web-browser"并检索其输出结果。 |
call-actor | 使用必填的两步工作流调用Apify Store中的任何Actor。 |
fetch-actor-details | 通过ID或全名(格式:"用户名/名称",例如"apify/rag-web-browser")获取Actor的详细信息。 |
fetch-apify-docs | 通过URL获取Apify文档页面的完整内容。 |
get-actor-output | 使用datasetId检索特定Actor运行的输出数据集项。 |
search-actors | 使用关键字搜索Apify Store中的Actor或Model Context Protocol (MCP)服务器。 |
search-apify-docs | 使用全文搜索Apify文档。 |
apify-slash-rag-web-browser此工具调用Actor "apify/rag-web-browser"并检索其输出结果。如果用户请求此特定Actor,请使用此工具而非"call-actor"。 Actor描述:适用于OpenAI助手、RAG管道或AI代理的Web浏览器(类似于***中的Web浏览器)。它查询Google搜索,抓取前N个页面,并将其内容以Markdown格式返回,供LLM进一步处理。它还可以抓取单个URL。此工具提供通用Web浏览功能,对于特定网站(如电子商务、社交媒体),最好搜索特定的Actor。
| 参数 | 类型 | 描述 |
|---|---|---|
query | string | 必填 输入Google搜索关键词或特定网页的URL。关键词可包含高级搜索运算符。示例: - san francisco weather- [[object Object]- function calling site:openai.com示例值:"web browser for RAG pipelines -site:" |
maxResults | integer 可选 | 将提取的Google搜索有机结果的最大数量。如果query是URL,则忽略此字段,Actor仅获取特定网页。示例值:3 |
outputFormats | array 可选 | 选择目标网页将被提取并保存到结果数据集中的一种或多种格式。 示例值:["markdown"] |
call-actor使用必填的两步工作流调用Apify Store中的任何Actor。这确保您在安全执行前先获取Actor的输入模式和详情。
有两种运行Actor的方式:
重要提示:
通常,成功运行会返回datasetId(Actor的输出存储为Apify数据集)和项目的简短预览。要获取完整输出,请使用get-actor-output工具并提供datasetId。
使用场景:
必填两步工作流: 步骤1:获取Actor信息(step="info",默认)
步骤2:调用Actor(step="call")
示例:
| 参数 | 类型 | 描述 |
|---|---|---|
actor | string | 要调用的Actor名称。例如,"apify/rag-web-browser"。 |
step | string | 要执行的步骤:"info"(获取Actor详情和输入模式,必填第一步),"call"(运行Actor,仅在获取信息后)。 |
callOptions | object 可选 | Actor运行配置的可选调用选项。 |
input | object 可选 | 传递给Actor的输入JSON。例如,{"query": "apify", "maxResults": 5}。仅在step="call"时使用。 |
fetch-actor-details通过ID或全名(格式:"用户名/名称",例如"apify/rag-web-browser")获取Actor的详细信息。返回Actor的标题、描述、URL、README(文档)、输入模式、定价/使用信息和基本统计数据。以用户友好的Actor卡片形式呈现信息。
使用场景:
使用示例:
| 参数 | 类型 | 描述 |
|---|---|---|
actor | string | Actor ID或全名,格式为"用户名/名称",例如"apify/rag-web-browser"。 |
fetch-apify-docs通过URL获取Apify文档页面的完整内容。在使用search-apify-docs工具找到相关页面后使用此工具。
使用场景:
使用示例:
| 参数 | 类型 | 描述 |
|---|---|---|
url | string | 要获取的Apify文档页面URL。必须是完整URL,包括协议(例如[***] |
get-actor-output使用datasetId检索特定Actor运行的输出数据集项。可以选择返回特定字段(支持点表示法,如"crawl.statusCode"),并通过offset和limit分页结果。此工具是get-dataset-items工具的简化版本,专注于Actor运行输出。
结果将包含指定数据集的数据集项。如果提供fields,仅包含这些字段(通过点表示法支持嵌套字段)。
可从Actor运行(例如,使用call-actor工具调用Actor后)或Apify控制台(运行 → 运行详情 → 数据集ID)获取datasetId。
使用场景:
使用示例:
注意:如果Apify MCP Server配置了任何Actor工具(例如"apify-slash-rag-web-browser")或可与Actor交互的工具(例如"call-actor"、"add-actor"),此工具会自动包含。
| 参数 | 类型 | 描述 |
|---|---|---|
datasetId | string | 要检索的Actor输出数据集ID。 |
fields | string 可选 | 要包含的逗号分隔字段列表(支持点表示法,如"crawl.statusCode")。例如:"crawl.statusCode,text,metadata" |
limit | number 可选 | 返回的最大项目数(默认:100)。 |
offset | number 可选 | 要跳过的项目数(默认:0)。 |
search-actors使用关键字搜索Apify Store中的Actor或Model Context Protocol (MCP)服务器。Apify Store提供Web抓取、自动化和AI代理的解决方案(例如Instagram、***、LinkedIn、航班、预订)。
结果将包含带有标题、描述、定价模型、使用统计和评分的精选Actor卡片。要获取特定Actor的详细信息,请使用fetch-actor-details工具。
使用场景:
使用示例:
| 参数 | 类型 | 描述 |
|---|---|---|
category | string 可选 | 按指定类别筛选结果。 |
limit | integer 可选 | 返回的最大Actor数量。默认值为10。 |
offset | integer 可选 | 开始时跳过的元素数量。默认值为0。 |
search | string 可选 | 在Actor的标题、名称、描述、用户名和README中搜索的字符串。使用简单的空格分隔关键字,例如"web scraping"、"data extraction"或"playwright browser mcp"。不要使用复杂查询、AND/OR运算符或其他高级语法,因为此工具仅使用全文搜索。 |
search-apify-docs使用全文搜索Apify文档。可用于基于关键字查找相关文档。Apify文档包含关于Apify控制台、Actor(开发(actor.json、输入模式、数据集模式、dockerfile)、部署、构建、运行)、计划、存储(数据集、键值存储)、代理、集成、Apify学院(使用Crawlee进行抓取和Web抓取)的信息。
结果将包含文档页面的URL、片段标识符(如果有)以及与搜索查询匹配的有限内容。通过提供URL,使用fetch-apify-docs工具获取文档的完整内容。
使用场景:
使用示例:
| 参数 | 类型 | 描述 |
|---|---|---|
query | string | Algolia全文搜索查询,用于查找相关文档页面。仅使用关键字,不要使用完整句子或问题。例如,"standby actor"将返回包含"standby"和"actor"字样的文档页面。 |
limit | number 可选 | 返回的最大搜索结果数。默认为5。如果需要更多结果,可以增加此限制,但请注意搜索结果仅限于最相关的页面。 |
offset | number 可选 | 搜索结果的偏移量。默认为0。用于分页浏览搜索结果。例如,如果要获取接下来的5个结果,将offset设置为5,limit设置为5。 |
json{ "mcpServers": { "apify-mcp-server": { "command": "docker", "args": [ "run", "-i", "--rm", "-e", "TOOLS", "-e", "APIFY_TOKEN", "mcp/apify-mcp-server" ], "env": { "TOOLS": "actors,docs,apify/rag-web-browser", "APIFY_TOKEN": "your-apify-token" } } } }
为什么使用Docker运行MCP服务器更安全?

manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务