
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Snowplow Transformer for Kinesis是Snowplow数据处理生态系统的核心组件,专门设计用于处理和转换来自Amazon Kinesis流的事件数据。作为数据处理管道的中间层,它接收原始或半结构化事件数据,执行规范化、丰富和格式转换操作,输出结构化数据以支持后续分析、存储或进一步处理。该镜像为容器化部署提供支持,简化了在各类环境中的集成与扩展。
bashdocker run -d \ --name snowplow-transformer-kinesis \ -e AWS_REGION="us-east-1" \ -e INPUT_STREAM_NAME="snowplow-raw-events" \ -e OUTPUT_STREAM_NAME="snowplow-transformed-events" \ -e TRANSFORMATION_CONFIG_PATH="/config/transformer.json" \ -e LOG_LEVEL="INFO" \ -v /host/path/to/config:/config \ snowplow/transformer-kinesis:latest
环境变量配置
| 参数名 | 描述 | 必填 | 示例值 |
|---|---|---|---|
AWS_REGION | Kinesis流所在的AWS区域 | 是 | us-east-1 |
INPUT_STREAM_NAME | 输入Kinesis流名称(待处理数据来源) | 是 | snowplow-raw-events |
OUTPUT_STREAM_NAME | 输出Kinesis流名称(转换后数据目标) | 否* | snowplow-transformed-events |
TRANSFORMATION_CONFIG_PATH | 转换规则配置文件路径(容器内路径) | 是 | /config/transformer.json |
AWS_ACCESS_KEY_ID | AWS访问密钥ID(如未通过IAM角色授权) | 否 | AKIAEXAMPLE123 |
AWS_SECRET_ACCESS_KEY | AWS密钥(如未通过IAM角色授权) | 否 | secret123example |
LOG_LEVEL | 日志级别(DEBUG/INFO/WARN/ERROR) | 否 | INFO |
WORKER_THREADS | 处理线程数(控制并发能力) | 否 | 4 |
MAX_RECORD_SIZE | 单条记录最大大小(字节) | 否 | 1048576 |
*注:若无需输出到Kinesis流,可配置
OUTPUT_S3_BUCKET指定S3目标存储(需额外配置S3相关参数)。
转换规则配置文件示例(transformer.json)
json{ "schema": "iglu:com.snowplowanalytics.snowplow/transformer_config/jsonschema/1-0-0", "data": { "outputFormat": "JSON", // 输出格式:JSON/Parquet/Avro "compression": "NONE", // 压缩方式:NONE/GZIP/SNAPPY "enrichments": [ // 启用的数据丰富规则(需提前加载至Iglu注册表) "iglu:com.snowplowanalytics.snowplow/ua_parser_enrichment/jsonschema/1-0-0", "iglu:com.snowplowanalytics.snowplow/geo_ip_enrichment/jsonschema/2-0-0" ], "validations": { "strictSchemaValidation": true, // 是否启用严格Schema校验 "allowMissingFields": false // 是否允许缺失非必需字段 }, "fieldMappings": { // 自定义字段映射(覆盖默认字段名) "app_id": "application_id", "event_name": "event_type" } } }
yamlversion: "3.8" services: transformer: image: snowplow/transformer-kinesis:latest container_name: snowplow-transformer environment: - AWS_REGION=us-east-1 - INPUT_STREAM_NAME=snowplow-raw-events - OUTPUT_STREAM_NAME=snowplow-transformed-events - TRANSFORMATION_CONFIG_PATH=/config/transformer.json - LOG_LEVEL=INFO - WORKER_THREADS=8 volumes: - ./config:/config # 挂载本地配置目录 restart: unless-stopped resources: limits: cpus: '2' memory: 4G
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务