
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
该镜像为Docker Swarm环境提供Spark集群部署方案,包含Master和Worker组件。主要用于进行Spark集群的性能测试,支持通过多种配置和拓扑结构验证集群性能表现。后续将添加更多测试应用,以丰富测试场景。
以下是Docker Swarm环境下的Spark集群部署配置示例,更多示例(包括Zookeeper HA模式)可在docker目录中找到:
yamlversion: "3.7" services: spark-master: image: jarzamendia/spark-master:staging ports: - "8080:8080" # Master Web UI端口 - "7077:7077" # Master通信端口 networks: spark-network: environment: - INIT_DAEMON_STEP=setup_spark # 初始化步骤 - SPARK_PUBLIC_DNS=spark.local # 公共DNS - SPARK_MASTER_HOST=spark-master # Master主机名 deploy: mode: global placement: constraints: - "node.role==manager" # 仅部署在manager节点 spark-worker: image: jarzamendia/spark-worker:staging hostname: "{{.Node.Hostname}}" # 使用节点主机名 ports: - "8081:8081" # Worker Web UI端口 environment: - SPARK_MASTER=spark://spark-master:7077 # Master地址 - SPARK_WORKER_CORES=1 # Worker可用CPU核心数 - SPARK_WORKER_MEMORY=1G # Worker可用内存 - SPARK_DRIVER_MEMORY=128m # Driver内存 - SPARK_EXECUTOR_MEMORY=256m # Executor内存 - SPARK_PUBLIC_DNS={{.Node.Hostname}}-worker.spark.local # Worker公共DNS - SPARK_DAEMON_JAVA_OPTS=-Dspark.metrics.conf=/opt/spark/conf/metrics.properties # Java选项 deploy: mode: global placement: constraints: - "node.role==worker" # 仅部署在worker节点 networks: spark-network: networks: spark-network:
Master节点环境变量
INIT_DAEMON_STEP: 初始化步骤,默认为setup_sparkSPARK_PUBLIC_DNS: 公共DNS名称SPARK_MASTER_HOST: Master节点主机名Worker节点环境变量
SPARK_MASTER: Master节点地址,格式为spark://<master-host>:7077SPARK_WORKER_CORES: 分配给Worker的CPU核心数SPARK_WORKER_MEMORY: 分配给Worker的内存总量SPARK_DRIVER_MEMORY: Driver进程内存SPARK_EXECUTOR_MEMORY: Executor进程内存SPARK_PUBLIC_DNS: Worker节点公共DNS名称SPARK_DAEMON_JAVA_OPTS: Spark daemon的Java选项所有Spark容器中,/opt/spark/examples目录包含多种语言的示例应用。可通过spark-submit命令执行这些示例。
进入Master容器:
bashdocker exec -it <spark-master-container-id> /bin/bash
执行Python示例计算Pi值:
bashspark-submit --master spark://spark-master:7077 /opt/spark/examples/src/main/python/pi.py 1000
测试建议:
SPARK_WORKER_CORES、SPARK_WORKER_MEMORY)进行性能对比您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务