
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
该Docker镜像基于Chrome浏览器和Puppeteer构建,提供便捷的项目数据提取环境。Puppeteer作为Node.js库,可通过API控制Chrome浏览器实现网页自动化操作,本镜像整合了Chrome运行时与Puppeteer依赖,无需额外配置即可直接使用,适用于各类需要浏览器环境支持的数据提取任务。
启动容器并执行默认数据提取脚本:
bashdocker run -d --name data-extractor [镜像名称]
将本地脚本目录挂载至容器内/app/scripts目录,执行自定义提取逻辑:
bashdocker run -d --name data-extractor -v /本地脚本目录:/app/scripts [镜像名称] node /app/scripts/your-script.js
| 环境变量 | 描述 | 默认值 |
|---|---|---|
CHROME_ARGS | Chrome启动参数(如--no-sandbox、--disable-gpu) | --no-sandbox --disable-setuid-sandbox |
PUPPETEER_HEADLESS | 是否以无头模式运行Chrome(true/false) | true |
PAGE_LOAD_TIMEOUT | 页面加载超时时间(毫秒) | 30000 |
DATA_OUTPUT_PATH | 提取数据输出路径 | /app/output |
创建docker-compose.yml文件:
yamlversion: '3' services: data-extractor: image: [镜像名称] volumes: - ./scripts:/app/scripts # 挂载自定义脚本目录 - ./output:/app/output # 挂载数据输出目录 environment: - CHROME_ARGS=--no-sandbox --disable-gpu --disable-dev-shm-usage - PUPPETEER_HEADLESS=true - PAGE_LOAD_TIMEOUT=60000 # 超时时间设置为60秒 command: node /app/scripts/extract-data.js # 执行自定义脚本
启动服务:
bashdocker-compose up -d
创建extract-data.js脚本(保存至./scripts目录):
javascriptconst puppeteer = require('puppeteer'); const fs = require('fs'); const path = require('path'); async function extractData() { // 启动浏览器 const browser = await puppeteer.launch({ args: process.env.CHROME_ARGS.split(' '), headless: process.env.PUPPETEER_HEADLESS === 'true' }); // 创建页面 const page = await browser.newPage(); await page.setDefaultTimeout(parseInt(process.env.PAGE_LOAD_TIMEOUT)); try { // 导航到目标页面 await page.goto('https://example.com'); // 提取页面数据(示例:标题和所有链接) const data = await page.evaluate(() => { return { title: document.title, links: Array.from(document.querySelectorAll('a')).map(a => a.href) }; }); // 保存数据到输出目录 const outputPath = path.join(process.env.DATA_OUTPUT_PATH, 'extracted-data.json'); fs.writeFileSync(outputPath, JSON.stringify(data, null, 2)); console.log(`数据提取完成,保存至:${outputPath}`); } catch (error) { console.error('数据提取失败:', error); } finally { // 关闭浏览器 await browser.close(); } } // 执行提取函数 extractData();
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务