linkedin/datahub-gmsDataHub GMS(Graph Metadata Store)是LinkedIn开源数据目录平台DataHub的核心元数据服务组件。作为DataHub架构的关键部分,GMS负责元数据的持久化存储、统一管理、查询处理及变更传播,为DataHub前端界面、元数据 ingestion 服务等提供底层元数据支持,是实现数据发现、数据治理和团队协作的基础。
bashdocker run -d \ --name datahub-gms \ -p 8080:8080 \ -e DATAHUB_DB_HOST=mysql \ -e DATAHUB_DB_PORT=3306 \ -e DATAHUB_DB_NAME=datahub \ -e DATAHUB_DB_USERNAME=datahub \ -e DATAHUB_DB_PASSWORD=DataHub123! \ -e ELASTICSEARCH_HOST=elasticsearch \ -e ELASTICSEARCH_PORT=9200 \ -e KAFKA_BOOTSTRAP_SERVERS=kafka:9092 \ linkedin/datahub-gms:latest
在DataHub完整部署架构中,GMS需与依赖服务协同工作,典型docker-compose.yml片段如下:
yamlversion: '3.8' services: gms: image: linkedin/datahub-gms:latest container_name: datahub-gms restart: always ports: - "8080:8080" environment: # 数据库配置 - DATAHUB_DB_HOST=mysql - DATAHUB_DB_PORT=3306 - DATAHUB_DB_NAME=datahub - DATAHUB_DB_USERNAME=datahub - DATAHUB_DB_PASSWORD=DataHub123! # Elasticsearch配置 - ELASTICSEARCH_HOST=elasticsearch - ELASTICSEARCH_PORT=9200 # Kafka配置 - KAFKA_BOOTSTRAP_SERVERS=kafka:9092 # 服务端口配置 - SERVER_PORT=8080 volumes: - gms-data:/tmp/datahub-gms depends_on: - mysql - elasticsearch - kafka volumes: gms-data:
| 参数名 | 描述 | 默认值 | 必须配置 |
|---|---|---|---|
| DATAHUB_DB_HOST | 元数据主数据库地址 | localhost | 是 |
| DATAHUB_DB_PORT | 数据库端口 | 3306 | 是 |
| DATAHUB_DB_NAME | 数据库名称 | datahub | 是 |
| DATAHUB_DB_USERNAME | 数据库访问用户名 | datahub | 是 |
| DATAHUB_DB_PASSWORD | 数据库访问密码 | datahub | 是 |
| ELASTICSEARCH_HOST | Elasticsearch主机地址 | localhost | 是 |
| ELASTICSEARCH_PORT | Elasticsearch端口 | 9200 | 是 |
| KAFKA_BOOTSTRAP_SERVERS | Kafka集群地址列表 | localhost:9092 | 是 |
| SERVER_PORT | GMS服务监听端口 | 8080 | 否 |
| JAVA_OPTS | JVM参数配置 | -Xmx1g | 否 |
linkedin/datahub-gms:v0.12.0)。JAVA_OPTS=-Xmx4g)及数据库连接池参数。manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务