轩辕镜像
轩辕镜像专业版
个人中心搜索镜像
交易
充值流量我的订单
工具
工单支持镜像收录Run 助手IP 归属地密码生成Npm 源Pip 源
帮助
常见问题我要吐槽
其他
关于我们网站地图

官方QQ群: 13763429

轩辕镜像
镜像详情
apache/gluten
官方博客使用教程热门镜像工单支持
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。
轩辕镜像 - 国内开发者首选的专业 Docker 镜像下载加速服务平台 - 官方QQ群:13763429 👈点击免费获得技术支持。
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

gluten Docker 镜像下载 - 轩辕镜像

gluten 镜像详细信息和使用指南

gluten 镜像标签列表和版本信息

gluten 镜像拉取命令和加速下载

gluten 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

gluten
apache/gluten

gluten 镜像详细信息

gluten 镜像标签列表

gluten 镜像使用说明

gluten 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

Apache Gluten是一个开源的Apache Spark加速器,通过集成列式存储和向量化执行引擎(如Velox、ClickHouse),显著提升Spark SQL查询性能,适用于大数据分析和数据仓库场景。
2 收藏0 次下载activeapache镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
中文简介版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

gluten 镜像详细说明

gluten 使用指南

gluten 配置说明

gluten 官方文档

Apache Gluten Docker镜像文档

镜像概述

Apache Gluten Docker镜像是预配置的容器化环境,用于快速部署和运行Apache Gluten加速的Apache Spark集群。Gluten作为Spark的查询加速器,通过集成高效的执行引擎(如Meta Velox、ClickHouse)和优化技术(向量化执行、列式存储),可将Spark SQL查询性能提升2-10倍,同时保持与原生Spark的兼容性,降低迁移成本。

核心功能与特性

1. 多执行引擎支持

  • 兼容主流向量化执行引擎:Velox(默认)、ClickHouse、Arrow等
  • 可动态切换后端引擎,适应不同数据处理场景需求

2. 性能优化

  • 向量化执行:替代Spark原生行式处理,大幅提升CPU利用率
  • 列式存储优化:高效数据压缩与编码,减少I/O开销
  • 内存管理优化:减少JVM GC压力,提升内存使用效率

3. 兼容性保障

  • 完全兼容Spark SQL语法和API,无需修改现有Spark作业
  • 支持Spark 3.x系列版本,无缝集成现有Spark生态(Hive、HDFS、S3等)

4. 易于部署

  • 预配置Spark和Gluten环境,无需手动编译依赖
  • 支持容器编排工具(Kubernetes、Docker Compose),适合规模化部署

使用场景

  • 大数据分析平台:提升PB级数据的SQL查询速度,缩短数据分析周期
  • 企业数据仓库:优化ETL流程和即席查询性能,支持高并发分析场景
  • 实时数据处理:结合Spark Streaming,加速流数据聚合与分析
  • 云原生数据湖:与对象存储(S3、OSS)集成,优化数据湖查询效率

使用方法

基本部署(Docker Run)

docker run -d \
  --name gluten-spark \
  -e SPARK_MASTER="local[*]" \
  -e GLUTEN_BACKEND="velox" \
  -e SPARK_DRIVER_MEMORY="4g" \
  -e SPARK_EXECUTOR_MEMORY="8g" \
  -p 4040:4040 \
  apache/gluten:latest

环境变量配置

环境变量描述默认值
SPARK_MASTERSpark集群Master地址(如spark://host:7077或local[*])local[*]
GLUTEN_BACKEND选择Gluten后端引擎(支持velox、clickhouse、arrow)velox
SPARK_DRIVER_MEMORYSpark Driver内存大小2g
SPARK_EXECUTOR_MEMORYSpark Executor内存大小4g
GLUTEN_LOG_LEVELGluten日志级别(DEBUG/INFO/WARN/ERROR)INFO
SPARK_SQL_EXTENSIONSSpark SQL扩展类(启用Gluten需设置为io.glutenproject.sql.GlutenSparkSessionExtension)自动配置

高级配置(Spark属性)

通过spark-defaults.conf自定义Spark和Gluten属性,可通过挂载配置文件实现:

docker run -d \
  --name gluten-spark \
  -v ./spark-defaults.conf:/opt/spark/conf/spark-defaults.conf \
  apache/gluten:latest

示例spark-defaults.conf配置:

# 启用Gluten加速
spark.sql.extensions io.glutenproject.sql.GlutenSparkSessionExtension
# 配置Velox后端内存限制
spark.gluten.velox.memory_pool.size 16g
# 启用向量化执行
spark.gluten.sql.columnar.backend.velox.vectorized true
# 优化Shuffle性能
spark.shuffle.manager org.apache.spark.shuffle.sort.ColumnarShuffleManager

Docker Compose示例

version: '3'
services:
  gluten-spark:
    image: apache/gluten:latest
    container_name: gluten-spark
    environment:
      - SPARK_MASTER=local[4]
      - GLUTEN_BACKEND=velox
      - SPARK_DRIVER_MEMORY=8g
      - SPARK_EXECUTOR_MEMORY=16g
    ports:
      - "4040:4040"  # Spark UI端口
      - "18080:18080" # Spark History Server端口
    volumes:
      - ./data:/opt/spark/data  # 挂载数据目录
      - ./spark-defaults.conf:/opt/spark/conf/spark-defaults.conf
    restart: unless-stopped

验证部署

  1. 访问Spark UI:http://localhost:4040
  2. 执行测试SQL验证加速效果:
    docker exec -it gluten-spark /opt/spark/bin/spark-sql \
      -e "SELECT count(*) FROM parquet.`/opt/spark/data/sample.parquet`"
    
  3. 查看Gluten日志确认后端引擎加载:
    docker logs gluten-spark | grep "Gluten backend initialized with"
    

注意事项

  • 选择后端引擎时需确保对应依赖已安装(如clickhouse后端需提前部署ClickHouse集群)
  • 生产环境建议通过Kubernetes进行容器编排,实现资源弹性伸缩
  • 性能调优需根据数据量和查询特征调整内存配置(如spark.gluten.velox.memory_pool.size)
查看更多 gluten 相关镜像 →

常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像免费版与专业版有分别支持哪些镜像?

免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

轩辕镜像下载加速使用手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

🔐

登录方式进行 Docker 镜像下载加速教程

通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤

🐧

Linux Docker 镜像下载加速教程

在 Linux 系统上配置轩辕镜像源,支持主流发行版

🖥️

Windows/Mac Docker 镜像下载加速教程

在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统

📦

Docker Compose 镜像下载加速教程

在 Docker Compose 中使用轩辕镜像加速,支持容器编排

📋

K8s containerd 镜像下载加速教程

在 k8s 中配置 containerd 使用轩辕镜像加速

🔧

宝塔面板 Docker 镜像下载加速教程

在宝塔面板中配置轩辕镜像加速,提升服务器管理效率

💾

群晖 NAS Docker 镜像下载加速教程

在 Synology 群晖NAS系统中配置轩辕镜像加速

🐂

飞牛fnOS Docker 镜像下载加速教程

在飞牛fnOS系统中配置轩辕镜像加速

📱

极空间 NAS Docker 镜像下载加速教程

在极空间NAS中配置轩辕镜像加速

⚡

爱快路由 ikuai Docker 镜像下载加速教程

在爱快ikuai系统中配置轩辕镜像加速

🔗

绿联 NAS Docker 镜像下载加速教程

在绿联NAS系统中配置轩辕镜像加速

🌐

威联通 NAS Docker 镜像下载加速教程

在威联通NAS系统中配置轩辕镜像加速

📦

Podman Docker 镜像下载加速教程

在 Podman 中配置轩辕镜像加速,支持多系统

📚

ghcr、Quay、nvcr、k8s、gcr 等仓库下载镜像加速教程

配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤

🚀

专属域名方式进行 Docker 镜像下载加速教程

无需登录即可使用轩辕镜像加速服务,更加便捷高效

需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429

商务:17300950906
|©2024-2025 源码跳动
商务合作电话:17300950906|Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.