
mcp/browserbase允许LLM通过Browserbase和Stagehand控制浏览器,实现AI驱动的Web自动化、智能数据提取和截图捕获。
什么是MCP Server?
| 属性 | 详情 |
|---|---|
| Docker镜像 | mcp/browserbase |
| 作者 | browserbase |
| 代码仓库 | [***] |
| 属性 | 详情 |
|---|---|
| Dockerfile | [***] |
| Docker镜像构建者 | Docker Inc. |
| Docker Scout健康评分 | !Docker Scout Health Score |
| 验证签名 | COSIGN_REPOSITORY=mcp/signatures cosign verify mcp/browserbase --key [***] |
| 许可证 | Apache许可证2.0 |
| 服务器提供的工具 | 简短描述 |
|---|---|
browserbase_screenshot | 捕获全页截图并返回(并保存为资源)。 |
browserbase_session_close | 关闭当前Browserbase会话并重置活动上下文。 |
browserbase_session_create | 创建或重用Browserbase浏览器会话并将其设为活动状态。 |
browserbase_stagehand_act | 在页面上执行单个操作(如点击、输入)。 |
browserbase_stagehand_extract | 使用指令从当前页面提取结构化数据或文本。 |
browserbase_stagehand_get_url | 返回当前页面URL(包含查询参数/片段的完整URL)。 |
browserbase_stagehand_navigate | 在浏览器中导航到指定URL。 |
browserbase_stagehand_observe | 根据指令查找页面上的交互式元素;可选返回操作。 |
browserbase_screenshot捕获全页截图并返回(并保存为资源)。
| 参数 | 类型 | 描述 |
|---|---|---|
name | string 可选 | 截图名称 |
browserbase_session_close关闭当前Browserbase会话并重置活动上下文。
browserbase_session_create创建或重用Browserbase浏览器会话并将其设为活动状态。
| 参数 | 类型 | 描述 |
|---|---|---|
sessionId | string 可选 | 要使用/重用的会话ID。若未提供或无效,将创建新会话。 |
browserbase_stagehand_act在页面上执行单个操作(如点击、输入)。
| 参数 | 类型 | 描述 |
|---|---|---|
action | string | 要执行的操作。应尽可能原子化和具体,例如“点击登录按钮”或“在搜索框中输入'hello'”。 |
variables | object 可选 | 操作模板中使用的变量。仅在处理敏感数据或动态内容时使用变量。使用变量时,操作模板中必须包含变量键。例如:{"action": "填写密码", "variables": {"password": "***"}} |
browserbase_stagehand_extract使用指令从当前页面提取结构化数据或文本。
| 参数 | 类型 | 描述 |
|---|---|---|
instruction | string | 从当前页面提取信息的具体指令。应尽可能详细和具体地说明要提取的内容。例如:“从列表页提取所有产品名称和价格”。指令越具体,提取结果越好。 |
browserbase_stagehand_get_url返回当前页面URL(包含查询参数/片段的完整URL)。
browserbase_stagehand_navigate在浏览器中导航到指定URL。仅在确定URL有效且最新时使用此工具,否则使用[***]
| 参数 | 类型 | 描述 |
|---|---|---|
url | string | 要导航到的URL |
browserbase_stagehand_observe根据指令查找页面上的交互式元素;可选返回操作。
| 参数 | 类型 | 描述 |
|---|---|---|
instruction | string | 在网页上观察特定元素或组件的详细指令。此指令必须极其具体和描述性。例如:“找到右上角的红色登录按钮”、“定位带有占位文本的搜索输入框”或“识别页面上所有可点击的产品卡片”。指令越具体详细,观察结果越好。避免使用“查找按钮”或“查看元素”等通用指令。相反,描述要观察的元素的视觉特征、位置、文本内容或功能。此工具旨在帮助识别可交互元素,之后可使用act工具执行点击、输入或表单提交等操作。 |
returnAction | boolean 可选 | 是否返回对元素执行的操作。若为true,操作将以字符串形式返回;若为false,则不返回操作。 |
json{ "mcpServers": { "browserbase": { "command": "docker", "args": [ "run", "-i", "--rm", "-e", "BROWSERBASE_API_KEY", "-e", "BROWSERBASE_PROJECT_ID", "-e", "GEMINI_API_KEY", "mcp/browserbase" ], "env": { "BROWSERBASE_API_KEY": "YOUR_BROWSERBASE_API_KEY_HERE", "BROWSERBASE_PROJECT_ID": "YOUR_BROWSERBASE_PROJECT_ID_HERE", "GEMINI_API_KEY": "YOUR_GEMINI_API_KEY_HERE" } } } }
为什么使用Docker运行MCP Server更安全?





manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务