如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
这是Apache Spark的Docker镜像。该镜像基于openjdk:8u171-jre-alpine3.8,体积小巧,包含Kafka库,还提供支持PySpark的衍生镜像(gradiant/spark:2.4.0-python)和支持SparkR的衍生镜像(gradiant/spark:2.4.0-R)。
示例:在容器内本地执行Spark Pi计算任务
docker run -ti gradiant/spark:2.4.0 spark-submit \ --master local[*] \ --class org.apache.spark.examples.SparkPi $SPARK_HOME/examples/jars/spark-examples_2.11-2.4.0.jar 100
Master节点容器
执行standalone master命令启动Master节点:
docker run -d gradiant/spark standalone master
可选环境变量配置:
Worker节点容器
执行standalone worker <master_url>命令启动Worker节点:
docker run -d gradiant/spark standalone worker <master_url> [options]
参数说明:
<master_url>:必须为spark://hostname:port格式的Master地址-c CORES:Worker使用的核心数-m MEM:Worker使用的内存量(如1000M、2G)可选环境变量配置:
Standalone集群示例(测试用)
docker network create sparknet docker run -d -p 8080:8080 --name spark-master gradiant/spark standalone master docker run -d --net sparknet --name spark-worker1 gradiant/spark:2.4.0 standalone worker spark://spark-master:7077 docker run -d --net sparknet --name spark-worker2 gradiant/spark:2.4.0 standalone worker spark://spark-master:7077 docker run -d --net sparknet --name spark-worker3 gradiant/spark:2.4.0 standalone worker spark://spark-master:7077
向上述Standalone集群提交Pi任务示例:
docker run -ti --net sparknet --rm gradiant/spark:2.4.0 spark-submit \ --master spark://spark-master:7077 \ --class org.apache.spark.examples.SparkPi $SPARK_HOME/examples/jars/spark-examples_2.11-2.4.0.jar 100
参考官方文档,以下是在K8s集群提交任务的示例。
前提条件
kubectl create serviceaccount spark kubectl create rolebinding spark-role --clusterrole=edit --serviceaccount=default:spark --namespace=default
提交任务步骤
kubectl proxy
API地址:http://127.0.0.1:8001
docker run --rm -ti --net host gradiant/spark:2.4.0 spark-submit \ --master k8s://http://127.0.0.1:8001 \ --deploy-mode cluster \ --name spark-pi \ --class org.apache.spark.examples.SparkPi \ --conf spark.executor.instances=2 \ --conf spark.kubernetes.authenticate.driver.serviceAccountName=spark \ --conf spark.kubernetes.container.image=gradiant/spark:2.4.0 \ --conf spark.kubernetes.executor.request.cores=0.2 \ --executor-memory 500M \ $SPARK_HOME/examples/jars/spark-examples_2.11-2.4.0.jar 100
注意:上述配置为测试用,资源参数设置较低,适合资源有限的集群。可通过K8s Dashboard查看Driver Pod状态及日志。
以下是 gradiant/spark 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。



来自真实用户的反馈,见证轩辕镜像的优质服务