
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Apache Zeppelin 是一个基于 Web 的交互式数据分析笔记本,支持通过 SQL、Scala 等多种语言进行数据探索、处理与可视化。该 Docker 镜像封装了 Zeppelin 的核心功能,提供便捷的部署方式,适用于快速搭建交互式数据分析环境,支持与 Apache Spark 等大数据框架集成,满足数据科学、数据工程及团队协作场景的需求。
官方推荐使用 Apache Zeppelin 官方镜像(假设镜像名为 apache/zeppelin,实际使用时请确认最新镜像标签):
bashdocker pull apache/zeppelin:latest
通过 docker run 命令快速启动 Zeppelin 服务,默认暴露 Web 端口并持久化笔记本数据:
bashdocker run -d \ --name zeppelin \ -p 8080:8080 \ # 映射 Web 访问端口(容器内默认 8080) -v /path/to/local/notebooks:/zeppelin/notebook \ # 持久化笔记本数据到本地目录 -e ZEPPELIN_MEM="-Xmx2g -Xms1g" \ # 配置 JVM 内存(根据主机资源调整) apache/zeppelin:latest
参数说明
-p 8080:8080:将容器内 Zeppelin Web 服务端口(8080)映射到宿主机 8080 端口,外部可通过 http://宿主机IP:8080 访问。-v /path/to/local/notebooks:/zeppelin/notebook:挂载宿主机目录到容器内笔记本存储路径(/zeppelin/notebook),避免容器重启后数据丢失。-e ZEPPELIN_MEM:设置 Zeppelin JVM 内存参数,根据宿主机资源调整(如 -Xmx4g -Xms2g 表示最大堆内存 4G,初始堆内存 2G)。通过 Docker Compose 配置文件管理 Zeppelin 服务,可集成 Spark 集群或其他依赖服务(以下为基础示例):
创建 docker-compose.yml 文件:
yamlversion: '3.8' services: zeppelin: image: apache/zeppelin:latest container_name: zeppelin ports: - "8080:8080" # Web 访问端口 - "4040:4040" # Spark UI 端口(若启用 Spark 应用,可选映射) volumes: - ./notebooks:/zeppelin/notebook # 本地笔记本数据卷 - ./conf:/zeppelin/conf # 自定义配置文件(如 interpreter.json、zeppelin-site.xml) environment: - ZEPPELIN_PORT=8080 # Web 服务端口(默认 8080,可自定义) - ZEPPELIN_MEM="-Xmx4g -Xms2g" # JVM 内存配置 - SPARK_MASTER="local[*]" # Spark 主节点地址(local[*] 表示本地模式,使用所有 CPU 核心) restart: unless-stopped # 容器退出时自动重启(除非手动停止)
启动服务:
bashdocker-compose up -d
服务启动后,通过浏览器访问:
http://<宿主机IP>:8080
首次访问需等待 Zeppelin 初始化(约 1-2 分钟),初始化完成后进入笔记本界面,可创建新笔记本或导入现有笔记本。
环境变量
| 环境变量 | 描述 | 默认值 | 示例值 |
|---|---|---|---|
ZEPPELIN_PORT | Web 服务监听端口 | 8080 | 8888 |
ZEPPELIN_MEM | JVM 内存参数 | -Xmx1g -Xms512m | -Xmx4g -Xms2g -XX:MaxPermSize=512m |
SPARK_MASTER | Spark 主节点地址 | local[*] | spark://spark-master:7077 |
ZEPPELIN_NOTEBOOK_DIR | 笔记本存储目录 | /zeppelin/notebook | /data/zeppelin/notebooks |
端口说明
| 端口 | 用途 | 是否必须映射 |
|---|---|---|
| 8080 | Zeppelin Web 服务端口 | 是 |
| 4040 | Spark 应用 UI 端口 | 否(仅调试用) |
| 8081 | Zeppelin 守护进程端口 | 否(内部使用) |
数据卷挂载
| 容器内路径 | 用途 | 宿主机挂载建议路径 |
|---|---|---|
/zeppelin/notebook | 存储笔记本文件(.json 格式) | ./notebooks 或 /data/zeppelin/notebooks |
/zeppelin/conf | 配置文件目录(如解释器配置) | ./conf (自定义配置时挂载) |
/zeppelin/logs | 日志文件目录 | ./logs (需持久化日志时挂载) |
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务