本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com
Apache Zeppelin 是一个基于 Web 的交互式数据分析笔记本,支持通过 SQL、Scala 等多种语言进行数据探索、处理与可视化。该 Docker 镜像封装了 Zeppelin 的核心功能,提供便捷的部署方式,适用于快速搭建交互式数据分析环境,支持与 Apache Spark 等大数据框架集成,满足数据科学、数据工程及团队协作场景的需求。
官方推荐使用 Apache Zeppelin 官方镜像(假设镜像名为 apache/zeppelin,实际使用时请确认最新镜像标签):
docker pull apache/zeppelin:latest
通过 docker run 命令快速启动 Zeppelin 服务,默认暴露 Web 端口并持久化笔记本数据:
docker run -d \ --name zeppelin \ -p 8080:8080 \ # 映射 Web 访问端口(容器内默认 8080) -v /path/to/local/notebooks:/zeppelin/notebook \ # 持久化笔记本数据到本地目录 -e ZEPPELIN_MEM="-Xmx2g -Xms1g" \ # 配置 JVM 内存(根据主机资源调整) apache/zeppelin:latest
-p 8080:8080:将容器内 Zeppelin Web 服务端口(8080)映射到宿主机 8080 端口,外部可通过 [***] 访问。-v /path/to/local/notebooks:/zeppelin/notebook:挂载宿主机目录到容器内笔记本存储路径(/zeppelin/notebook),避免容器重启后数据丢失。-e ZEPPELIN_MEM:设置 Zeppelin JVM 内存参数,根据宿主机资源调整(如 -Xmx4g -Xms2g 表示最大堆内存 4G,初始堆内存 2G)。通过 Docker Compose 配置文件管理 Zeppelin 服务,可集成 Spark 集群或其他依赖服务(以下为基础示例):
创建 docker-compose.yml 文件:
version: '3.8' services: zeppelin: image: apache/zeppelin:latest container_name: zeppelin ports: - "8080:8080" # Web 访问端口 - "4040:4040" # Spark UI 端口(若启用 Spark 应用,可选映射) volumes: - ./notebooks:/zeppelin/notebook # 本地笔记本数据卷 - ./conf:/zeppelin/conf # 自定义配置文件(如 interpreter.json、zeppelin-site.xml) environment: - ZEPPELIN_PORT=8080 # Web 服务端口(默认 8080,可自定义) - ZEPPELIN_MEM="-Xmx4g -Xms2g" # JVM 内存配置 - SPARK_MASTER="local[*]" # Spark 主节点地址(local[*] 表示本地模式,使用所有 CPU 核心) restart: unless-stopped # 容器退出时自动重启(除非手动停止)
启动服务:
docker-compose up -d
服务启动后,通过浏览器访问:
http://<宿主机IP>:8080
首次访问需等待 Zeppelin 初始化(约 1-2 分钟),初始化完成后进入笔记本界面,可创建新笔记本或导入现有笔记本。
| 环境变量 | 描述 | 默认值 | 示例值 |
|---|---|---|---|
ZEPPELIN_PORT | Web 服务监听端口 | 8080 | 8888 |
ZEPPELIN_MEM | JVM 内存参数 | -Xmx1g -Xms512m | -Xmx4g -Xms2g -XX:MaxPermSize=512m |
SPARK_MASTER | Spark 主节点地址 | local[*] | spark://spark-master:7077 |
ZEPPELIN_NOTEBOOK_DIR | 笔记本存储目录 | /zeppelin/notebook | /data/zeppelin/notebooks |
| 端口 | 用途 | 是否必须映射 |
|---|---|---|
| 8080 | Zeppelin Web 服务端口 | 是 |
| 4040 | Spark 应用 UI 端口 | 否(仅调试用) |
| 8081 | Zeppelin 守护进程端口 | 否(内部使用) |
| 容器内路径 | 用途 | 宿主机挂载建议路径 |
|---|---|---|
/zeppelin/notebook | 存储笔记本文件(.json 格式) | ./notebooks 或 /data/zeppelin/notebooks |
/zeppelin/conf | 配置文件目录(如解释器配置) | ./conf (自定义配置时挂载) |
/zeppelin/logs | 日志文件目录 | ./logs (需持久化日志时挂载) |
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429