snowplow/transformer-kinesisSnowplow Transformer for Kinesis是Snowplow数据处理生态系统的核心组件,专门设计用于处理和转换来自Amazon Kinesis流的事件数据。作为数据处理管道的中间层,它接收原始或半结构化事件数据,执行规范化、丰富和格式转换操作,输出结构化数据以支持后续分析、存储或进一步处理。该镜像为容器化部署提供支持,简化了在各类环境中的集成与扩展。
bashdocker run -d \ --name snowplow-transformer-kinesis \ -e AWS_REGION="us-east-1" \ -e INPUT_STREAM_NAME="snowplow-raw-events" \ -e OUTPUT_STREAM_NAME="snowplow-transformed-events" \ -e TRANSFORMATION_CONFIG_PATH="/config/transformer.json" \ -e LOG_LEVEL="INFO" \ -v /host/path/to/config:/config \ snowplow/transformer-kinesis:latest
| 参数名 | 描述 | 必填 | 示例值 |
|---|---|---|---|
AWS_REGION | Kinesis流所在的AWS区域 | 是 | us-east-1 |
INPUT_STREAM_NAME | 输入Kinesis流名称(待处理数据来源) | 是 | snowplow-raw-events |
OUTPUT_STREAM_NAME | 输出Kinesis流名称(转换后数据目标) | 否* | snowplow-transformed-events |
TRANSFORMATION_CONFIG_PATH | 转换规则配置文件路径(容器内路径) | 是 | /config/transformer.json |
AWS_ACCESS_KEY_ID | AWS访问密钥ID(如未通过IAM角色授权) | 否 | AKIAEXAMPLE123 |
AWS_SECRET_ACCESS_KEY | AWS密钥(如未通过IAM角色授权) | 否 | secret123example |
LOG_LEVEL | 日志级别(DEBUG/INFO/WARN/ERROR) | 否 | INFO |
WORKER_THREADS | 处理线程数(控制并发能力) | 否 | 4 |
MAX_RECORD_SIZE | 单条记录最大大小(字节) | 否 | *** |
*注:若无需输出到Kinesis流,可配置
OUTPUT_S3_BUCKET指定S3目标存储(需额外配置S3相关参数)。
json{ "schema": "iglu:com.snowplowanalytics.snowplow/transformer_config/jsonschema/1-0-0", "data": { "outputFormat": "JSON", // 输出格式:JSON/Parquet/Avro "compression": "NONE", // 压缩方式:NONE/GZIP/SNAPPY "enrichments": [ // 启用的数据丰富规则(需提前加载至Iglu注册表) "iglu:com.snowplowanalytics.snowplow/ua_parser_enrichment/jsonschema/1-0-0", "iglu:com.snowplowanalytics.snowplow/geo_ip_enrichment/jsonschema/2-0-0" ], "validations": { "strictSchemaValidation": true, // 是否启用严格Schema校验 "allowMissingFields": false // 是否允许缺失非必需字段 }, "fieldMappings": { // 自定义字段映射(覆盖默认字段名) "app_id": "application_id", "event_name": "event_type" } } }
yamlversion: "3.8" services: transformer: image: snowplow/transformer-kinesis:latest container_name: snowplow-transformer environment: - AWS_REGION=us-east-1 - INPUT_STREAM_NAME=snowplow-raw-events - OUTPUT_STREAM_NAME=snowplow-transformed-events - TRANSFORMATION_CONFIG_PATH=/config/transformer.json - LOG_LEVEL=INFO - WORKER_THREADS=8 volumes: - ./config:/config # 挂载本地配置目录 restart: unless-stopped resources: limits: cpus: '2' memory: 4G


manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务