轩辕镜像
轩辕镜像专业版
个人中心搜索镜像
交易
充值流量我的订单
工具
工单支持镜像收录Run 助手IP 归属地密码生成Npm 源Pip 源
帮助
常见问题我要吐槽
其他
关于我们网站地图

官方QQ群: 13763429

轩辕镜像
镜像详情
acryldata/datahub-ingestion-base
官方博客使用教程热门镜像工单支持
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。
轩辕镜像 - 国内开发者首选的专业 Docker 镜像下载加速服务平台 - 官方QQ群:13763429 👈点击免费获得技术支持。
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

datahub-ingestion-base Docker 镜像下载 - 轩辕镜像

datahub-ingestion-base 镜像详细信息和使用指南

datahub-ingestion-base 镜像标签列表和版本信息

datahub-ingestion-base 镜像拉取命令和加速下载

datahub-ingestion-base 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

datahub-ingestion-base
acryldata/datahub-ingestion-base

datahub-ingestion-base 镜像详细信息

datahub-ingestion-base 镜像标签列表

datahub-ingestion-base 镜像使用说明

datahub-ingestion-base 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

DataHub数据摄取容器的基础镜像
0 次下载activeacryldata镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
中文简介版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

datahub-ingestion-base 镜像详细说明

datahub-ingestion-base 使用指南

datahub-ingestion-base 配置说明

datahub-ingestion-base 官方文档

DataHub Ingestion 基础镜像文档

镜像概述和主要用途

DataHub Ingestion 基础镜像是 DataHub 数据摄入生态的底层支撑镜像,旨在为各类 DataHub 数据摄入容器提供标准化的运行环境和基础依赖。该镜像预配置了 DataHub 数据摄入所需的核心运行时、依赖库及文件系统结构,简化自定义数据摄入逻辑的开发与部署流程,确保不同摄入组件在运行环境上的一致性。

核心功能和特性

核心功能

  1. 标准化运行环境:提供 DataHub 摄入组件所需的 Python 运行时(默认 Python 3.9+)及基础系统库。
  2. 预安装核心依赖:内置 datahub-ingestion 核心库、常用数据源连接器(如 MySQL、PostgreSQL、Kafka 等)及数据处理工具(如 pandas、pyarrow)。
  3. 统一文件系统结构:规范配置文件(/etc/datahub/ingestion)、日志(/var/log/datahub/ingestion)及临时文件(/tmp/datahub)的存储路径。

特性

  • 轻量级设计:基于 Alpine Linux 或 Slim Debian,最小化镜像体积。
  • 环境变量配置:支持通过环境变量动态调整摄入参数(如日志级别、配置文件路径)。
  • 健康检查机制:内置基础健康检查脚本,支持容器编排平台(如 Kubernetes、Docker Compose)的状态监控。
  • 扩展性支持:预留自定义依赖安装入口,可通过 requirements.txt 或 pip install 扩展第三方库。

使用场景和适用范围

使用场景

  1. 自定义摄入源开发:基于该镜像构建包含自定义数据源(如企业内部系统、私有 API)连接器的容器。
  2. 摄入逻辑扩展:扩展 DataHub 现有摄入功能(如数据脱敏、格式转换、自定义元数据提取)。
  3. 多环境一致性部署:在开发、测试、生产环境中复用统一基础镜像,避免环境差异导致的运行问题。

适用范围

  • DataHub 用户及开发者:需构建自定义数据摄入容器的场景。
  • 数据平台团队:批量部署或集成多个数据源的 DataHub 摄入任务。
  • 容器化部署场景:适配 Docker、Kubernetes 等容器编排平台的 DataHub 摄入任务。

使用方法和配置说明

基础使用流程

  1. 基于基础镜像构建自定义镜像:通过 Dockerfile 添加自定义摄入脚本或依赖。
  2. 配置参数:通过环境变量或挂载配置文件定义摄入规则。
  3. 运行容器:启动容器并挂载必要的卷(如配置文件、日志目录)。

环境变量配置

支持以下环境变量调整运行参数,无默认值的变量需显式指定:

环境变量名描述默认值示例值
LOG_LEVEL日志级别(DEBUG/INFO/WARN/ERROR)INFODEBUG
INGESTION_CONFIG_PATH摄入配置文件路径(绝对路径)/etc/datahub/ingestion/config.yml/app/custom-config.yml
DATAHUB_GMS_ENDPOINTDataHub GMS 服务地址(元数据写入目标)[***][***]
MAX_RETRY_COUNT数据摄入失败重试次数35

配置文件挂载

若需使用自定义配置文件(如 YAML 格式的摄入规则),可通过卷挂载覆盖默认配置路径:

-v /本地配置目录:/etc/datahub/ingestion

Docker部署示例

1. 基于基础镜像构建自定义镜像(Dockerfile)

# 基于 DataHub Ingestion 基础镜像
FROM datahub-ingestion-base:latest

# 添加自定义摄入脚本(假设脚本位于本地 ./custom_ingestion 目录)
COPY ./custom_ingestion /app/custom_ingestion

# 安装额外依赖(如需)
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# 设置工作目录
WORKDIR /app/custom_ingestion

# 入口命令(执行自定义摄入脚本)
CMD ["python", "main.py"]

2. 直接运行容器(docker run)

docker run -d \
  --name datahub-ingestion-custom \
  -e LOG_LEVEL=DEBUG \
  -e DATAHUB_GMS_ENDPOINT=[***] \
  -v /local/config:/etc/datahub/ingestion \  # 挂载自定义配置
  -v /local/logs:/var/log/datahub/ingestion \  # 挂载日志目录
  datahub-ingestion-base:latest

3. Docker Compose 配置示例

version: '3.8'
services:
  datahub-ingestion:
    image: datahub-ingestion-base:latest
    container_name: datahub-ingestion
    environment:
      - LOG_LEVEL=INFO
      - INGESTION_CONFIG_PATH=/etc/datahub/ingestion/custom-config.yml
      - DATAHUB_GMS_ENDPOINT=[***]
    volumes:
      - ./config:/etc/datahub/ingestion  # 本地配置目录挂载
      - ./logs:/var/log/datahub/ingestion  # 日志持久化
    restart: unless-stopped
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8000/health"]  # 基础健康检查(需摄入脚本实现 /health 端点)
      interval: 30s
      timeout: 10s
      retries: 3

注意事项

  1. 版本兼容性:确保基础镜像版本与 datahub-ingestion 核心库版本匹配(参考 DataHub 官方文档 的版本矩阵)。
  2. 依赖冲突:自定义依赖安装时需避免与基础镜像内置依赖版本冲突(可通过 pip freeze 查看基础镜像依赖列表)。
  3. 资源限制:根据数据量调整容器 CPU/内存资源(如大数据量摄入建议配置 ≥2 CPU 核心、4GB 内存)。
查看更多 datahub-ingestion-base 相关镜像 →
r-base logo
r-base
by library
官方
R是一款开源的统计计算与图形绘制系统,具备强大的数据处理、分析、建模及可视化功能,拥有丰富的扩展包生态与活跃的全球社区支持,广泛应用于学术研究、数据分析、机器学习等领域,为用户提供从数据清洗到结果呈现的全流程解决方案。
55810M+ pulls
上次更新:5 天前

常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像免费版与专业版有分别支持哪些镜像?

免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

轩辕镜像下载加速使用手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

🔐

登录方式进行 Docker 镜像下载加速教程

通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤

🐧

Linux Docker 镜像下载加速教程

在 Linux 系统上配置轩辕镜像源,支持主流发行版

🖥️

Windows/Mac Docker 镜像下载加速教程

在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统

📦

Docker Compose 镜像下载加速教程

在 Docker Compose 中使用轩辕镜像加速,支持容器编排

📋

K8s containerd 镜像下载加速教程

在 k8s 中配置 containerd 使用轩辕镜像加速

🔧

宝塔面板 Docker 镜像下载加速教程

在宝塔面板中配置轩辕镜像加速,提升服务器管理效率

💾

群晖 NAS Docker 镜像下载加速教程

在 Synology 群晖NAS系统中配置轩辕镜像加速

🐂

飞牛fnOS Docker 镜像下载加速教程

在飞牛fnOS系统中配置轩辕镜像加速

📱

极空间 NAS Docker 镜像下载加速教程

在极空间NAS中配置轩辕镜像加速

⚡

爱快路由 ikuai Docker 镜像下载加速教程

在爱快ikuai系统中配置轩辕镜像加速

🔗

绿联 NAS Docker 镜像下载加速教程

在绿联NAS系统中配置轩辕镜像加速

🌐

威联通 NAS Docker 镜像下载加速教程

在威联通NAS系统中配置轩辕镜像加速

📦

Podman Docker 镜像下载加速教程

在 Podman 中配置轩辕镜像加速,支持多系统

📚

ghcr、Quay、nvcr、k8s、gcr 等仓库下载镜像加速教程

配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤

🚀

专属域名方式进行 Docker 镜像下载加速教程

无需登录即可使用轩辕镜像加速服务,更加便捷高效

需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429

商务:17300950906
|©2024-2025 源码跳动
商务合作电话:17300950906|Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.