apache/hopApache Hop Docker镜像封装了Apache Hop开源数据集成平台,提供开箱即用的ETL(抽取、转换、加载)解决方案。该镜像包含Hop引擎、可视化设计工具(Hop GUI)和命令行执行环境,支持通过图形界面或命令行方式设计、调试和运行数据管道,适用于各类数据处理场景的快速部署和集成。
通过以下命令快速启动Apache Hop容器(默认启动命令行界面):
bashdocker run -it --name hop-container apache/hop:latest
如需启动可视化GUI(需宿主机支持图形界面):
bashdocker run -it --name hop-gui \ -e DISPLAY=$DISPLAY \ -v /tmp/.X11-unix:/tmp/.X11-unix \ apache/hop:latest hop-gui
创建docker-compose.yml文件,配置包含持久化存储和自定义项目目录的部署:
yamlversion: '3.8' services: hop: image: apache/hop:latest container_name: hop-server volumes: - ./hop-projects:/hop/projects # 挂载本地项目目录 - ./hop-metadata:/hop/metadata # 挂载元数据存储目录 - ./hop-logs:/hop/logs # 挂载日志目录 environment: - HOP_HOME=/hop - HOP_PROJECT=my-data-pipeline # 默认项目名称 - HOP_ENVIRONMENT=production # 环境配置名称 - HOP_SERVER_PORT=8080 # Hop Server端口 ports: - "8080:8080" # 暴露Hop Server API端口 restart: unless-stopped
启动服务:
bashdocker-compose up -d
| 环境变量名 | 描述 | 默认值 |
|---|---|---|
HOP_HOME | Hop主目录路径 | /hop |
HOP_PROJECT | 默认加载的项目名称 | default |
HOP_ENVIRONMENT | 环境配置文件名称 | default |
HOP_SERVER_PORT | Hop Server监听端口 | 8080 |
HOP_SERVER_USER | Hop Server访问用户名 | admin |
HOP_SERVER_PASSWORD | Hop Server访问密码 | admin |
HOP_LOG_LEVEL | 日志级别(DEBUG/INFO/WARN/ERROR) | INFO |
为避免容器重启后数据丢失,建议挂载以下目录:
/hop/projects:存储数据管道项目文件(.hpl、.hwf等)/hop/metadata:存储元数据(数据源配置、转换历史等)/hop/logs:存储运行日志(执行记录、错误日志等)在容器内执行已设计的管道(.hpl文件):
bash# 进入容器 docker exec -it hop-container bash # 执行管道 hop-run -f /hop/projects/my-project/pipelines/extract-data.hpl -e production
-m 2g参数),复杂数据管道需更高配置--network=host或配置自定义网络)HOP_SERVER_USER和HOP_SERVER_PASSWORD),并限制容器网络访问权限
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务