linkedin/datahub-mae-consumerDataHub MAE Consumer是LinkedIn开源数据治理平台DataHub的核心组件之一,专门用于消费和处理元数据审计事件(Metadata Audit Events, MAE)。该组件从消息队列(如Kafka)接收元数据变更事件,进行解析、验证后更新至DataHub元数据存储,为数据治理流程提供元数据变更跟踪与审计能力。
metadata_audit_events)bashdocker pull linkedin/datahub-mae-consumer:latest
bashdocker run -d \ --name datahub-mae-consumer \ -e KAFKA_BOOTSTRAP_SERVERS=kafka:9092 \ -e ELASTICSEARCH_HOST=elasticsearch:9200 \ -e POSTGRES_HOST=postgres:5432 \ -e POSTGRES_USER=datahub \ -e POSTGRES_PASSWORD=datahub \ -e POSTGRES_DB=datahub \ linkedin/datahub-mae-consumer:latest
通过环境变量配置关键参数,常用配置如下:
| 环境变量 | 描述 | 默认值 |
|---|---|---|
KAFKA_BOOTSTRAP_SERVERS | Kafka集群地址 | localhost:9092 |
KAFKA_TOPIC_NAME | MAE事件主题名 | metadata_audit_events |
ELASTICSEARCH_HOST | Elasticsearch主机地址 | localhost:9200 |
POSTGRES_HOST | PostgreSQL主机地址 | localhost |
POSTGRES_PORT | PostgreSQL端口 | 5432 |
POSTGRES_USER | PostgreSQL用户名 | datahub |
POSTGRES_PASSWORD | PostgreSQL密码 | datahub |
CONSUMER_THREADS | 事件消费线程数 | 1 |
OFFSET_RESET_POLICY | Kafka偏移量重置策略 | earliest |
yamlversion: '3.8' services: mae-consumer: image: linkedin/datahub-mae-consumer:latest container_name: datahub-mae-consumer environment: - KAFKA_BOOTSTRAP_SERVERS=kafka:9092 - KAFKA_TOPIC_NAME=metadata_audit_events - ELASTICSEARCH_HOST=elasticsearch:9200 - POSTGRES_HOST=postgres:5432 - POSTGRES_USER=datahub - POSTGRES_PASSWORD=datahub - POSTGRES_DB=datahub - CONSUMER_THREADS=3 depends_on: - kafka - elasticsearch - postgres
CONSUMER_THREADS参数以优化性能


manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务