轩辕镜像
轩辕镜像专业版
个人中心搜索镜像
交易
充值流量我的订单
工具
工单支持镜像收录Run 助手IP 归属地密码生成Npm 源Pip 源
帮助
常见问题我要吐槽
其他
关于我们网站地图

官方QQ群: 13763429

轩辕镜像
镜像详情
acryldata/datahub-gms
官方博客使用教程热门镜像工单支持
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。
轩辕镜像 - 国内开发者首选的专业 Docker 镜像下载加速服务平台 - 官方QQ群:13763429 👈点击免费获得技术支持。
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

datahub-gms Docker 镜像下载 - 轩辕镜像

datahub-gms 镜像详细信息和使用指南

datahub-gms 镜像标签列表和版本信息

datahub-gms 镜像拉取命令和加速下载

datahub-gms 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

datahub-gms
acryldata/datahub-gms

datahub-gms 镜像详细信息

datahub-gms 镜像标签列表

datahub-gms 镜像使用说明

datahub-gms 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

DataHub GMS镜像作为开源数据目录平台DataHub的核心组件,提供元数据存储、查询与管理服务,支持数据发现及治理功能。
3 收藏0 次下载activeacryldata镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
中文简介版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

datahub-gms 镜像详细说明

datahub-gms 使用指南

datahub-gms 配置说明

datahub-gms 官方文档

DataHub GMS Image 技术文档

一、镜像概述和主要用途

DataHub GMS Image 是 DataHub 数据目录平台的核心服务镜像,封装了 General Metadata Service (GMS)。GMS 作为 DataHub 的元数据管理中枢,负责元数据的存储、检索、索引、变更处理及 API 服务,是连接数据生产者、消费者与数据资产的关键组件。

主要用途:

  • 提供元数据全生命周期管理(创建、读取、更新、删除)
  • 支撑 DataHub 前端界面与后端服务的数据交互
  • 处理元数据变更事件并同步至索引服务
  • 通过标准化 API 对外提供元数据访问能力

二、核心功能和特性

2.1 元数据存储与管理

  • 支持关系型数据库(MySQL/PostgreSQL)存储结构化元数据(如数据集、字段、标签、所有者信息)
  • 实现元数据版本控制,记录历史变更轨迹

2.2 元数据索引与检索

  • 与 Elasticsearch 深度集成,构建元数据索引以支持高效全文检索
  • 支持复杂过滤条件(如标签、所有者、数据类型)的元数据查询

2.3 API 服务

  • 提供 RESTful API 接口,支持元数据 CRUD、搜索、血缘查询等操作
  • 兼容 DataHub 前端 SDK 及第三方系统集成

2.4 事件驱动架构

  • 与 Kafka 集成,消费元数据变更事件(如数据 schema 变更)
  • 触发下游处理流程(如索引更新、通知推送)

2.5 多租户与扩展性

  • 支持多租户元数据隔离
  • 可扩展元数据模型,适配自定义业务需求

三、使用场景和适用范围

3.1 典型使用场景

  • 企业级数据目录构建:集中管理分散在 Hive、BigQuery、*** 等系统的元数据
  • 数据资产发现:通过全文检索、血缘分析帮助用户定位目标数据
  • 数据治理支持:追踪数据血缘、管理数据质量指标、执行标签/权限策略
  • 工具集成:与 Tableau、Airflow、Jupyter 等工具联动,同步元数据至业务场景
  • 自动化元数据管理:通过 API 批量同步元数据、触发变更通知

3.2 适用范围

  • 中大型企业数据平台(数据量 ≥ 10TB,数据源 ≥ 5 种)
  • 数据治理团队(需统一管理数据资产与合规流程)
  • 数据工程/科学团队(需高效发现与复用数据)

四、使用方法和配置说明

4.1 前提条件

  • Docker 19.03+ 环境
  • 依赖服务:MySQL 8.0+、Elasticsearch 7.10+、Kafka 2.8+
  • 网络:确保 GMS 与依赖服务互通,开放必要端口(默认 8080)

4.2 获取镜像

从 Docker Hub 或私有仓库拉取镜像:

docker pull acryldata/datahub-gms:latest  # 官方镜像(稳定版)
# 或指定版本:docker pull acryldata/datahub-gms:v0.12.0

4.3 基本运行命令(docker run)

最简示例(需提前启动依赖服务):

docker run -d \
  --name datahub-gms \
  -p 8080:8080 \
  -e DATAHUB_DB_HOST=mysql-host \
  -e DATAHUB_DB_PORT=3306 \
  -e DATAHUB_DB_USERNAME=root \
  -e DATAHUB_DB_PASSWORD=password \
  -e DATAHUB_DB_NAME=datahub \
  -e DATAHUB_ELASTICSEARCH_URI=[***] \
  -e DATAHUB_KAFKA_BOOTSTRAP_SERVERS=kafka:9092 \
  acryldata/datahub-gms:latest

参数说明:

  • -p 8080:8080:映射 GMS REST API 端口
  • 环境变量(-e):配置依赖服务连接信息(见 4.5 节详细说明)

4.4 docker-compose 配置示例

推荐通过 docker-compose 整合依赖服务,简化部署:

version: '3.8'
services:
  # GMS 服务
  datahub-gms:
    image: acryldata/datahub-gms:latest
    container_name: datahub-gms
    restart: always
    ports:
      - "8080:8080"
    environment:
      # 数据库配置
      DATAHUB_DB_HOST: mysql
      DATAHUB_DB_PORT: 3306
      DATAHUB_DB_USERNAME: datahub
      DATAHUB_DB_PASSWORD: datahub
      DATAHUB_DB_NAME: datahub
      # Elasticsearch 配置
      DATAHUB_ELASTICSEARCH_URI: [***]
      DATAHUB_ELASTICSEARCH_INDEX_NAME: datahub_usage_event
      # Kafka 配置
      DATAHUB_KAFKA_BOOTSTRAP_SERVERS: kafka:9092
      DATAHUB_METADATA_CHANGE_LOG_KAFKA_TOPIC_NAME: metadata-change-log
      # 日志配置
      LOG_LEVEL: INFO
    depends_on:
      mysql:
        condition: service_healthy
      elasticsearch:
        condition: service_healthy
      kafka:
        condition: service_started

  # 依赖服务:MySQL
  mysql:
    image: mysql:8.0
    container_name: datahub-mysql
    environment:
      MYSQL_ROOT_PASSWORD: root
      MYSQL_DATABASE: datahub
      MYSQL_USER: datahub
      MYSQL_PASSWORD: datahub
    ports:
      - "3306:3306"
    volumes:
      - mysql-data:/var/lib/mysql
    healthcheck:
      test: ["CMD", "mysqladmin", "ping", "-h", "localhost", "-u$datahub", "-p$datahub"]
      interval: 10s
      timeout: 5s
      retries: 5

  # 依赖服务:Elasticsearch
  elasticsearch:
    image: elasticsearch:7.17.0
    container_name: datahub-elasticsearch
    environment:
      - discovery.type=single-node
      - xpack.security.enabled=false
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"
    ports:
      - "9200:9200"
    volumes:
      - es-data:/usr/share/elasticsearch/data
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:9200/_cluster/health"]
      interval: 10s
      timeout: 5s
      retries: 5

  # 依赖服务:Kafka(含 Zookeeper)
  zookeeper:
    image: confluentinc/cp-zookeeper:7.0.0
    container_name: datahub-zookeeper
    environment:
      ZOOKEEPER_CLIENT_PORT: 2181
    ports:
      - "2181:2181"

  kafka:
    image: confluentinc/cp-kafka:7.0.0
    container_name: datahub-kafka
    depends_on:
      - zookeeper
    environment:
      KAFKA_BROKER_ID: 1
      KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181
      KAFKA_ADVERTISED_LISTENERS: PLAINTEXT://kafka:9092
      KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR: 1
    ports:
      - "9092:9092"

volumes:
  mysql-data:
  es-data:

启动命令:

docker-compose up -d

4.5 核心配置参数(环境变量)

环境变量名描述示例值
DATAHUB_DB_HOSTMySQL 主机地址mysql 或 192.168.1.100
DATAHUB_DB_PORTMySQL 端口3306
DATAHUB_DB_USERNAMEMySQL 用户名datahub
DATAHUB_DB_PASSWORDMySQL 密码datahub
DATAHUB_DB_NAMEMySQL 数据库名datahub
DATAHUB_ELASTICSEARCH_URIElasticsearch 地址[***]
DATAHUB_ELASTICSEARCH_INDEX_NAME元数据索引名datahub_metadata
DATAHUB_KAFKA_BOOTSTRAP_SERVERSKafka 地址列表kafka:9092 或 kafka1:9092,kafka2:9092
DATAHUB_METADATA_CHANGE_LOG_KAFKA_TOPIC_NAME元数据变更日志主题metadata-change-log
LOG_LEVEL日志级别(DEBUG/INFO/WARN/ERROR)INFO
SERVER_PORTGMS 服务端口8080(默认)
MAX_HEAP_SIZEJVM 堆内存上限2g(默认)

4.6 持久化配置

为避免容器重启导致数据丢失,需挂载以下目录:

docker run -d \
  ...
  -v /path/on/host/gms/logs:/app/logs \  # 日志持久化
  -v /path/on/host/gms/config:/app/config  # 自定义配置文件(如需)
  ...

4.7 健康检查

GMS 内置健康检查接口,可通过以下命令验证服务状态:

curl -f http://localhost:8080/actuator/health || echo "GMS 服务异常"

4.8 高级配置

  • 自定义元数据模型:挂载自定义 model.json 至 /app/config/model.json
  • JVM 参数调整:通过 JAVA_OPTS 环境变量设置,如 -e JAVA_OPTS="-Xms1g -Xmx4g"
  • SSL 加密:配置 DATAHUB_ELASTICSEARCH_USE_SSL=true 及证书路径

五、常见问题

  • 依赖服务连接失败:检查 docker-compose 中服务名是否与环境变量一致(如 DATAHUB_DB_HOST=mysql 需与 MySQL 服务名匹配)
  • 元数据索引不更新:确认 Kafka 主题 metadata-change-log 存在且可写
  • API 访问超时:调大 MAX_HEAP_SIZE 或检查数据库/Elasticsearch 性能
查看更多 datahub-gms 相关镜像 →

常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像免费版与专业版有分别支持哪些镜像?

免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

轩辕镜像下载加速使用手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

🔐

登录方式进行 Docker 镜像下载加速教程

通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤

🐧

Linux Docker 镜像下载加速教程

在 Linux 系统上配置轩辕镜像源,支持主流发行版

🖥️

Windows/Mac Docker 镜像下载加速教程

在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统

📦

Docker Compose 镜像下载加速教程

在 Docker Compose 中使用轩辕镜像加速,支持容器编排

📋

K8s containerd 镜像下载加速教程

在 k8s 中配置 containerd 使用轩辕镜像加速

🔧

宝塔面板 Docker 镜像下载加速教程

在宝塔面板中配置轩辕镜像加速,提升服务器管理效率

💾

群晖 NAS Docker 镜像下载加速教程

在 Synology 群晖NAS系统中配置轩辕镜像加速

🐂

飞牛fnOS Docker 镜像下载加速教程

在飞牛fnOS系统中配置轩辕镜像加速

📱

极空间 NAS Docker 镜像下载加速教程

在极空间NAS中配置轩辕镜像加速

⚡

爱快路由 ikuai Docker 镜像下载加速教程

在爱快ikuai系统中配置轩辕镜像加速

🔗

绿联 NAS Docker 镜像下载加速教程

在绿联NAS系统中配置轩辕镜像加速

🌐

威联通 NAS Docker 镜像下载加速教程

在威联通NAS系统中配置轩辕镜像加速

📦

Podman Docker 镜像下载加速教程

在 Podman 中配置轩辕镜像加速,支持多系统

📚

ghcr、Quay、nvcr、k8s、gcr 等仓库下载镜像加速教程

配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤

🚀

专属域名方式进行 Docker 镜像下载加速教程

无需登录即可使用轩辕镜像加速服务,更加便捷高效

需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429

商务:17300950906
|©2024-2025 源码跳动
商务合作电话:17300950906|Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.