
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
本镜像旨在提供一个标准化容器环境,用于自动化执行夜间数据构建与验证工作流。通过封装数据处理逻辑与执行环境,确保数据构建流程的一致性、可重复性和可靠性,满足企业级数据处理场景中定时执行数据构建与质量验证的需求。
dockerdocker run -d \ --name nightly-data-workflow \ -v /host/data:/app/data \ -v /host/config:/app/config \ -e SCHEDULE="0 2 * * *" \ # 每天凌晨2点执行 -e DATA_SOURCE_CONFIG="/app/config/source.json" \ -e VALIDATION_RULES="/app/config/rules.yaml" \ -e LOG_LEVEL="INFO" \ -e ALERT_EMAIL="data-admin@example.com" \ [镜像名称]:[版本标签]
yamlversion: '3.8' services: data-workflow: image: [镜像名称]:[版本标签] container_name: nightly-data-pipeline volumes: - ./data:/app/data:rw - ./config:/app/config:ro - ./logs:/app/logs:rw environment: - SCHEDULE=0 1 * * * - DATA_SOURCE_CONFIG=/app/config/source_config.json - VALIDATION_RULES=/app/config/validation_rules.yaml - LOG_LEVEL=DEBUG - ALERT_EMAIL=team@example.com - MAX_RETRY=3 - OUTPUT_FORMAT=parquet restart: unless-stopped
环境变量配置
| 参数名 | 描述 | 可选值 | 默认值 |
|---|---|---|---|
| SCHEDULE | 任务执行时间(Cron表达式) | 标准Cron格式 | "0 0 * * *"(午夜执行) |
| DATA_SOURCE_CONFIG | 数据源配置文件路径 | 容器内绝对路径 | 无(必填) |
| VALIDATION_RULES | 验证规则配置文件路径 | 容器内绝对路径 | "/app/config/default_rules.yaml" |
| LOG_LEVEL | 日志输出级别 | DEBUG/INFO/WARN/ERROR | "INFO" |
| ALERT_EMAIL | 异常通知*** | 合法***地址 | 无 |
| MAX_RETRY | 任务失败重试次数 | 正整数 | 2 |
| OUTPUT_FORMAT | 数据输出格式 | csv/json/parquet | "parquet" |
| EXECUTION_TIMEOUT | 任务超时时间(分钟) | 正整数 | 120 |
数据源配置文件示例(JSON格式)
json{ "type": "postgresql", "connection": { "host": "db-host", "port": 5432, "database": "source_db", "user": "etl_user", "password": "${DB_PASSWORD}" // 支持环境变量引用 }, "tables": ["user_behavior", "order_transaction"], "incremental_field": "update_time" }
验证规则配置示例(YAML格式)
yamlintegrity_checks: - table: "user_behavior" checks: - "required_columns:user_id,action_type,timestamp" - "row_count:>10000" - "null_rate:user_id<0.01" accuracy_checks: - table: "order_transaction" checks: - "field_range:amount>0" - "format_validation:order_no=^ORD\\d{10}$" - "cross_validate:order_status IN ('pending','completed','cancelled')" consistency_checks: - "sum(amount) in order_transaction == sum(payment_amount) in payment_records"
/app/logs/workflow-YYYYMMDD.log/app/data/output/-v参数挂载主机目录实现数据持久化容器内置健康检查机制,可通过以下命令查看工作流状态:
dockerdocker exec nightly-data-workflow /app/bin/check_status.sh
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务