本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

iomete公共Spark镜像是由iomete提供的Docker镜像,基于Apache Spark官方版本构建,旨在简化Spark应用程序的部署与运行流程。该镜像预先集成了常用依赖库(如Hadoop、AWS SDK、JDBC驱动等)和性能优化配置,使开发者无需手动配置环境即可快速启动Spark集群或提交Spark作业。
spark.memory.offHeap.enabled=true)3.3.0、3.4.0、3.5.0),适配不同应用需求spark-submit、spark-shell等工具的快捷启动脚本spark-shell或pyspark交互模式)通过Docker Hub拉取最新版本:
docker pull iomete/spark:latest
拉取指定Spark版本(如3.4.0):
docker pull iomete/spark:3.4.0
# Scala Shell docker run -it --rm iomete/spark:latest spark-shell # Python Shell (PySpark) docker run -it --rm iomete/spark:latest pyspark
本地有打包好的Spark应用JAR包(如my-spark-app.jar)时,通过spark-submit提交:
docker run -v /local/path/to/my-spark-app.jar:/app.jar \ iomete/spark:latest \ spark-submit \ --class com.example.MyApp \ --master local[*] \ # 本地模式,使用所有CPU核心 /app.jar
创建docker-compose.yml文件:
version: '3' services: spark-master: image: iomete/spark:latest command: bin/spark-class org.apache.spark.deploy.master.Master ports: - "7077:7077" # Master通信端口 - "8080:8080" # Web UI端口 environment: - SPARK_MASTER_HOST=spark-master spark-worker: image: iomete/spark:latest command: bin/spark-class org.apache.spark.deploy.worker.Worker spark://spark-master:7077 environment: - SPARK_WORKER_MEMORY=2g # Worker内存分配 - SPARK_WORKER_CORES=2 # Worker CPU核心数 depends_on: - spark-master
启动集群:
docker-compose up -d
访问 http://localhost:8080 可查看Spark Master Web UI。
通过-e参数传递环境变量调整Spark配置:
| 环境变量 | 说明 | 默认值 |
|---|---|---|
SPARK_MASTER | Spark Master地址(如spark://host:7077) | local[*](本地模式) |
SPARK_DRIVER_MEMORY | Driver进程内存分配 | 1g |
SPARK_EXECUTOR_MEMORY | Executor进程内存分配 | 1g |
SPARK_EXECUTOR_CORES | 每个Executor的CPU核心数 | 1 |
PYSPARK_PYTHON | PySpark使用的Python解释器路径 | /usr/bin/python3 |
示例:调整Driver内存为4G并指定Master地址
docker run -e SPARK_DRIVER_MEMORY=4g -e SPARK_MASTER=spark://master:7077 iomete/spark:latest spark-submit ...
通过挂载本地spark-defaults.conf覆盖默认配置:
docker run -v /local/path/to/spark-defaults.conf:/opt/spark/conf/spark-defaults.conf \ iomete/spark:latest \ spark-submit ...
3.4.0)而非latest,避免版本变更导致兼容性问题--executor-memory、--num-executors等参数调整资源分配AWS_ACCESS_KEY_ID、AWS_SECRET_ACCESS_KEY)

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429