专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像 官方专业版轩辕镜像 官方专业版官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 1072982923

apache/gravitino Docker 镜像 - 轩辕镜像

gravitino
apache/gravitino
Apache Gravitino(孵化中)是一个统一元数据平台,为数据湖、数据仓库及流处理系统提供统一元数据管理,简化数据治理并提升数据处理效率。
0 次下载
💣 CI/CD 卡在拉镜像?问题不在代码,在镜像源
中文简介版本下载
💣 CI/CD 卡在拉镜像?问题不在代码,在镜像源

Apache Gravitino (Incubating) Docker镜像文档

1. 镜像概述和主要用途

Apache Gravitino (Incubating) 是一款开源统一元数据管理平台,旨在解决多源异构数据系统的元数据碎片化问题。该Docker镜像封装了Gravitino服务端组件,提供开箱即用的元数据管理能力,支持快速部署和集成到现有数据平台架构中。

主要用途:

  • 整合多源元数据(如Hive、Iceberg、Delta Lake、Hudi等数据湖/仓),提供统一访问入口
  • 管理元数据生命周期(版本控制、变更追踪、血缘分析)
  • 实现跨系统元数据一致性和权限统一控制
  • 简化数据平台中多计算引擎(Spark、Flink、Trino等)的元数据协同

2. 核心功能和特性

2.1 多源元数据统一管理
  • 支持主流数据系统元数据接入:Hive Metastore、Iceberg、Delta Lake、Hudi、PostgreSQL等
  • 提供标准化元数据模型,屏蔽底层系统差异
2.2 元数据版本与血缘追踪
  • 元数据变更历史记录与版本回溯
  • 自动捕获表、列级数据血缘关系,支持上游依赖分析
2.3 统一权限控制
  • 基于RBAC(角色)的细粒度权限模型
  • 支持与LDAP/AD、OAuth2等身份认证系统集成
  • 跨数据源权限策略统一管理
2.4 高可用与扩展性
  • 分布式架构设计,支持水平扩展
  • 元数据存储支持MySQL、PostgreSQL等关系型数据库,确保数据可靠性
  • 内置缓存机制提升查询性能
2.5 开放生态集成
  • 提供RESTful API、Java/Python客户端SDK
  • 兼容Apache Atlas元数据导入/导出
  • 支持与数据治理平台(如Apache Ranger)联动

3. 使用场景和适用范围

3.1 典型使用场景
  • 数据湖/仓统一元数据管理:整合Hive Metastore、Iceberg等元数据,避免“元数据孤岛”
  • 多计算引擎协同:使Spark、Flink、Trino等引擎共享统一元数据视图,确保数据一致性
  • 元数据变更追踪:审计表结构变更、数据分区增减等操作,满足合规性要求
  • 企业级权限控制:跨数据系统统一配置数据访问权限,简化权限管理流程
3.2 适用范围
  • 中大型数据平台(数据量TB级以上,多数据源)
  • 多团队协作的数据开发/分析环境
  • 需要构建数据血缘、元数据治理体系的场景
  • 采用混合计算引擎(批处理+流处理+查询分析)的架构

4. 使用方法和配置说明

4.1 获取镜像

目前Gravitino官方镜像托管于Apache镜像仓库或Docker Hub(视孵化阶段而定),获取命令:

bash
docker pull apache/gravitino:incubating-0.5.0  # 替换为具体版本号
4.2 基本使用(docker run)
4.2.1 快速启动(使用内置H2数据库,仅用于测试)
bash
docker run -d \
  --name gravitino-test \
  -p 8090:8090 \
  apache/gravitino:incubating-0.5.0

注意:内置H2数据库不适合生产环境,数据会随容器销毁丢失。

4.2.2 生产环境启动(连接外部MySQL数据库)
bash
docker run -d \
  --name gravitino-server \
  -p 8090:8090 \
  -v /path/to/gravitino/data:/opt/gravitino/data \  # 持久化数据目录
  -e GRAVITINO_DB_TYPE=mysql \
  -e GRAVITINO_DB_URL=jdbc:mysql://mysql-host:3306/gravitino?useSSL=false \
  -e GRAVITINO_DB_USERNAME=root \
  -e GRAVITINO_DB_PASSWORD=password \
  -e GRAVITINO_SERVER_PORT=8090 \
  -e GRAVITINO_LOG_LEVEL=INFO \
  apache/gravitino:incubating-0.5.0
4.3 Docker Compose配置示例

创建docker-compose.yml文件,集成Gravitino与MySQL(生产环境推荐):

yaml
version: '3.8'
services:
  gravitino:
    image: apache/gravitino:incubating-0.5.0
    container_name: gravitino-server
    ports:
      - "8090:8090"
    environment:
      - GRAVITINO_DB_TYPE=mysql
      - GRAVITINO_DB_URL=jdbc:mysql://mysql:3306/gravitino?useSSL=false&allowPublicKeyRetrieval=true
      - GRAVITINO_DB_USERNAME=root
      - GRAVITINO_DB_PASSWORD= gravitino123
      - GRAVITINO_SERVER_PORT=8090
      - GRAVITINO_LOG_LEVEL=INFO
      - GRAVITINO_AUTH_ENABLED=true  # 启用认证
      - GRAVITINO_AUTH_TYPE=ldap  # 支持ldap/oauth2/none
      - GRAVITINO_LDAP_URL=ldap://ldap-server:389
      - GRAVITINO_LDAP_BASE_DN=dc=example,dc=com
    volumes:
      - gravitino-data:/opt/gravitino/data  # 持久化元数据
      - ./log:/opt/gravitino/logs  # 日志挂载
    depends_on:
      - mysql
    restart: unless-stopped

  mysql:
    image: mysql:8.0
    container_name: gravitino-mysql
    ports:
      - "3306:3306"
    environment:
      - MYSQL_ROOT_PASSWORD= gravitino123
      - MYSQL_DATABASE=gravitino
    volumes:
      - mysql-data:/var/lib/mysql
    restart: unless-stopped

volumes:
  gravitino-data:
  mysql-data:

启动命令:docker-compose up -d

4.4 环境变量配置详解
环境变量名描述默认值示例值
GRAVITINO_SERVER_PORT服务监听端口80908090
GRAVITINO_DB_TYPE元数据存储类型(支持mysql/postgresql)h2mysql
GRAVITINO_DB_URL数据库连接URLjdbc:h2:mem:gravitinojdbc:mysql://mysql:3306/gravitino?useSSL=false
GRAVITINO_DB_USERNAME数据库用户名saroot
GRAVITINO_DB_PASSWORD数据库密码空gravitino123
GRAVITINO_LOG_LEVEL日志级别(DEBUG/INFO/WARN/ERROR)INFOINFO
GRAVITINO_AUTH_ENABLED是否启用认证falsetrue
GRAVITINO_AUTH_TYPE认证类型(none/ldap/oauth2)noneldap
GRAVITINO_LDAP_URLLDAP服务URL(启用ldap认证时必填)-ldap://ldap-server:389
GRAVITINO_LDAP_BASE_DNLDAP基础DN-dc=example,dc=com
GRAVITINO_CACHE_ENABLED是否启用元数据缓存truetrue
GRAVITINO_CACHE_SIZE缓存大小(MB)128256
4.5 持久化与存储

Gravitino的核心数据包括:

  • 元数据存储(依赖外部数据库,通过GRAVITINO_DB_*配置)
  • 本地数据(如临时文件、插件):需挂载/opt/gravitino/data目录
  • 日志:推荐挂载/opt/gravitino/logs目录至宿主机,便于日志管理
4.6 网络配置
  • 端口映射:默认需映射8090端口(API端口),若启用监控可额外映射9090(Prometheus指标)
  • 外部依赖访问:确保容器能访问外部数据库(如MySQL)、LDAP服务等,可通过--network指定自定义网络

5. 验证部署

服务启动后,通过以下方式验证:

  1. 访问API:curl http://localhost:8090/api/v1/info,返回服务版本信息
  2. 查看日志:docker logs gravitino-server,确认无ERROR级日志
  3. 访问Web UI(若启用):http://localhost:8090(需在配置中启用Web控制台)

6. 注意事项

  • 生产环境必须使用外部数据库(MySQL/PostgreSQL),避免使用H2
  • 启用认证后需提前配置LDAP/OAuth2服务,确保连接正常
  • 元数据存储目录建议使用持久化卷(Volume),避免数据丢失
  • 版本升级前需备份数据库数据,参考官方升级指南

注:Apache Gravitino处于孵化阶段,功能和配置可能随版本迭代变化,建议参考官方文档获取最新信息。

查看更多 gravitino 相关镜像 →
apache/gravitino-ci logo
apache/gravitino-ci
暂无描述
100K+ pulls
上次更新:未知
apache/gravitino-playground logo
apache/gravitino-playground
暂无描述
10K+ pulls
上次更新:未知
apache/gravitino-iceberg-rest logo
apache/gravitino-iceberg-rest
暂无描述
6.4K pulls
上次更新:未知
apache/gravitino-mcp-server logo
apache/gravitino-mcp-server
暂无描述
1.2K pulls
上次更新:未知
apache/gravitino-lance-rest logo
apache/gravitino-lance-rest
暂无描述
502 pulls
上次更新:未知
datastrato/gravitino-ci-hive logo
datastrato/gravitino-ci-hive
暂无描述
100K+ pulls
上次更新:未知

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

Docker Compose

Docker Compose 项目配置

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

MacOS OrbStack

MacOS OrbStack 容器配置

宝塔面板

在宝塔面板一键配置镜像

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

极空间

极空间 NAS 系统配置服务

爱快路由

爱快 iKuai 路由系统配置

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 访问,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像支持哪些镜像仓库?

专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等;免费版仅支持 docker.io。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
apache/gravitino
官方博客Docker 镜像使用技巧与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
咨询镜像拉取问题请 提交工单,官方技术交流群:1072982923
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
咨询镜像拉取问题请提交工单,官方技术交流群:
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
官方邮箱:点击复制邮箱
©2024-2026 源码跳动
官方邮箱:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.