本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com
本Docker镜像提供预配置环境,旨在简化Apache Spark与Swift存储服务的连接流程。通过集成Spark-Swift连接器,消除手动配置依赖的复杂性,使开发和运维人员能够快速部署支持Swift数据访问的Spark环境,专注于数据处理逻辑而非连接配置。
通过以下命令启动镜像,替换环境变量为实际Swift认证信息和Spark配置:
docker run -d \ -e SWIFT_AUTH_URL="[***]" \ -e SWIFT_USERNAME="spark-service-account" \ -e SWIFT_PASSWORD="secure-auth-password" \ -e SWIFT_TENANT_NAME="service-tenant" \ -e SPARK_MASTER="local[*]" \ --name spark-swift-connector \ apache-spark-connect-swift:latest
创建docker-compose.yml文件实现多容器协同部署:
version: '3.8' services: spark-swift: image: apache-spark-connect-swift:latest container_name: spark-swift-connector environment: - SWIFT_AUTH_URL=[***] - SWIFT_USERNAME=spark-user - SWIFT_PASSWORD=P@ssw0rd123 - SWIFT_TENANT_NAME=analytics-tenant - SWIFT_REGION=RegionOne - SPARK_MASTER=spark://spark-master:7077 - SPARK_EXECUTOR_MEMORY=2g - SPARK_DRIVER_MEMORY=1g volumes: - ./spark-jobs:/opt/spark/jobs # 挂载本地Spark作业目录 - ./spark-logs:/var/log/spark # 挂载日志目录 depends_on: - spark-master restart: unless-stopped spark-master: image: bitnami/spark:latest container_name: spark-master environment: - SPARK_MODE=master ports: - "7077:7077" - "8080:8080"
启动命令:docker-compose up -d
| 环境变量名 | 描述 | 示例值 |
|---|---|---|
SWIFT_AUTH_URL | Swift认证服务URL | [***] |
SWIFT_USERNAME | Swift访问用户名 | spark-service-account |
SWIFT_PASSWORD | Swift用户认证密码 | secure-password-123 |
SWIFT_TENANT_NAME | Swift租户名称(Keystone v2) | analytics-tenant |
SPARK_MASTER | Spark集群Master地址 | local[*]或spark://master:7077 |
| 环境变量名 | 描述 | 默认值 |
|---|---|---|
SWIFT_REGION | Swift存储区域 | RegionOne |
SWIFT_CONTAINER | 默认Swift容器名称 | spark-data |
SPARK_EXECUTOR_MEMORY | Spark执行器内存配置 | 1g |
SPARK_DRIVER_MEMORY | Spark驱动程序内存配置 | 512m |
SPARK_APP_NAME | Spark应用名称标识 | spark-swift-connector-app |
进入运行中的容器:
docker exec -it spark-swift-connector bash
启动Spark Shell:
spark-shell
读取Swift中的CSV文件(假设Swift容器data-container中有user-data.csv):
val df = spark.read .format("csv") .option("header", "true") .option("inferSchema", "true") .load("swift2d://data-container.swift/user-data.csv") // 显示数据 df.show(10)
写入数据到Swift:
df.write .format("parquet") .mode("overwrite") .save("swift2d://data-container.swift/processed-user-data")
注意:
swift2d为连接器协议标识,具体协议名称可能因连接器版本不同略有差异,需参考镜像内置连接器文档。


免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429