专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像 官方专业版轩辕镜像 官方专业版官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 1072982923

热门搜索:openclaw🔥nginx🔥redis🔥mysqlopenjdkcursorweb2apimemgraphzabbixetcdubuntucorednsjdk
gemma4-safetensors

ai/gemma4-safetensors

Docker AI 官方镜像

Gemma 4是Google DeepMind开发的开源多模态AI模型系列,支持文本、图像(小模型含音频)输入与文本输出,优化用于推理、编码和长上下文处理,提供E2B、E4B、26B A4B、31B四种尺寸,适配从移动设备到服务器的部署需求。

下载次数: 0状态:社区镜像维护者:Docker AI 官方镜像仓库类型:镜像最近更新:15 天前
轩辕镜像,不浪费每一次拉取。点击查看
中文简介版本下载
轩辕镜像,不浪费每一次拉取。点击查看

Gemma 4 模型Docker镜像文档

镜像概述和主要用途

Gemma是Google DeepMind构建的开源模型系列。Gemma 4模型为多模态模型,支持文本和图像输入(E2B/E4B小模型额外支持音频)并生成文本输出,提供预训练和指令调优两种开源权重变体。该系列模型具备高达256K tokens的上下文窗口,支持140多种语言的多语言处理能力,采用密集型(Dense)和混合专家(MoE)架构,适用于文本生成、编码开发、逻辑推理等任务。其多样化尺寸(E2B、E4B、26B A4B、31B)可部署于高端手机、笔记本电脑及服务器等不同环境,推动先进AI技术的普及应用。

核心功能和特性

Gemma 4在能力与架构上实现关键突破:

  • 强化推理能力:全系列模型均设计为高性能推理器,支持可配置的思维模式
  • 扩展多模态支持:处理文本、图像(支持可变宽高比和分辨率)、视频,E2B/E4B模型原生支持音频
  • 高效多样化架构:提供不同尺寸的密集型和混合专家(MoE)变体,满足可扩展部署需求
  • 设备端优化设计:小模型针对笔记本电脑和移动设备的本地高效执行进行专门优化
  • 超大上下文窗口:小模型支持128K tokens,中型模型支持256K tokens
  • 增强编码与代理能力:编码基准测试性能显著提升,原生支持函数调用,赋能高性能自主代理
  • 原生系统提示支持:引入对system角色的原生支持,实现更结构化、可控的对话流程

模型架构与参数

Gemma 4模型采用混合注意力机制(局部滑动窗口注意力与全局注意力交错,确保最后一层为全局注意力),结合统一键值设计和比例RoPE(p-RoPE)优化长上下文内存占用,在保持轻量级模型处理速度和低内存特性的同时,保障复杂长上下文任务所需的深度感知能力。

密集型模型参数

属性E2BE4B31B Dense
总参数2.3B有效(含嵌入5.1B)4.5B有效(含嵌入8B)30.7B
层数354260
滑动窗口512 tokens512 tokens1024 tokens
上下文长度128K tokens128K tokens256K tokens
词汇量262K262K262K
支持模态文本、图像、音频文本、图像、音频文本、图像
视觉编码器参数~150M~150M~550M
音频编码器参数~300M~300M无

说明:E2B/E4B中的"E"代表"有效参数",采用每层嵌入(PLE)技术,为每个解码器层提供独立token嵌入,在不增加模型层数的前提下提升参数效率,适用于设备端部署。

混合专家(MoE)模型参数

属性26B A4B MoE
总参数25.2B
激活参数3.8B
层数30
滑动窗口1024 tokens
上下文长度256K tokens
词汇量262K
专家配置8个激活专家/128个总专家+1个共享专家
支持模态文本、图像
视觉编码器参数~550M

说明:26B A4B中的"A"代表"激活参数",推理时仅激活3.8B参数子集,运行速度接近4B参数模型,兼顾性能与效率,适合快速推理场景。

基准测试性能

以下为指令调优模型在各类任务中的评估结果:

任务Gemma 4 31BGemma 4 26B A4BGemma 4 E4BGemma 4 E2BGemma 3 27B(无思维)
MMLU Pro(多任务语言理解)85.2%82.6%69.4%60.0%67.6%
LiveCodeBench v6(代码生成)80.0%77.1%52.0%44.0%29.1%
GPQA Diamond(知识问答)84.3%82.3%58.6%43.4%42.4%
MMMU Pro(多模态理解)76.9%73.8%52.6%44.2%49.7%
MRCR v2 8 needle 128k(长上下文)66.4%44.1%25.4%19.1%13.5%

核心能力

Gemma 4模型具备多模态处理能力,可应对以下关键任务:

  • 思维推理:内置逐步推理模式,支持复杂问题求解
  • 长上下文处理:最大256K tokens上下文窗口,支持超长文本理解
  • 图像理解:实现对象检测、文档解析(PDF)、UI理解、图表分析、多语言OCR、手写识别等功能,支持可变分辨率与宽高比
  • 视频理解:通过帧序列分析实现视频内容理解
  • 多模态输入交错:支持在单个提示中自由混合文本与图像
  • 函数调用:原生支持结构化工具调用,赋能代理工作流
  • 代码能力:代码生成、补全与纠错
  • 多语言支持:原生支持35+种语言,预训练覆盖140+种语言
  • 音频处理(仅限E2B/E4B):多语言自动语音识别(ASR)与语音翻译

Docker部署指南

镜像拉取

bash
docker pull google/gemma4:latest

基础运行命令

bash
# 运行E4B模型(GPU加速)
docker run -it --gpus all -p 8080:8080 google/gemma4:latest \
  --model-size e4b \
  --context-length 128000 \
  --temperature 1.0 \
  --top-p 0.95 \
  --top-k 64

docker-compose配置示例

yaml
version: '3.8'
services:
  gemma4:
    image: google/gemma4:latest
    container_name: gemma4-service
    ports:
      - "8080:8080"
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]
    environment:
      - MODEL_SIZE=e4b
      - CONTEXT_LENGTH=128000
      - TEMPERATURE=1.0
      - TOP_P=0.95
      - TOP_K=64
    volumes:
      - ./data:/app/data  # 挂载数据持久化目录

使用最佳实践

1. 采样参数配置

推荐标准化采样参数:

  • temperature=1.0(控制随机性)
  • top_p=0.95(核采样)
  • top_k=64(Top-K采样)

2. 思维模式控制

  • 启用思维:在系统提示开头添加<|think|>令牌
  • 思维生成格式:启用时模型输出结构为:
    <|channel>thoughtn[内部推理内容]<channel|>
  • 禁用思维:移除<|think|>令牌,非E2B/E4B模型将生成空思维块:
    <|channel>thoughtn<channel|>[最终答案]

注意:Transformers、llama.cpp等库已集成聊天模板处理,无需手动管理令牌

3. 多轮对话管理

历史对话记录中仅保留最终响应,不得包含模型的内部推理内容。

4. 多模态输入优化

多模态提示中,建议将图像/音频内容置于文本内容之前,以获得最佳处理效果。

5. 图像分辨率配置

通过视觉令牌预算控制图像细节与推理速度,支持值:70/140/280/560/1120

  • 低预算(70/140):适用于分类、Captioning、视频处理等对速度要求高的场景
  • 高预算(560/1120):适用于OCR、文档解析、小文本识别等需细节的场景

6. 音频处理提示模板

语音识别(ASR):

text
Transcribe the following speech segment in {LANGUAGE} into {LANGUAGE} text.
Follow these specific instructions for formatting the answer:
* Only output the transcription, with no newlines.
* When transcribing numbers, write the digits, i.e. write 1.7 and not one point seven, and write 3 instead of three.

语音翻译(AST):

text
Transcribe the following speech segment in {SOURCE_LANGUAGE}, then translate it into {TARGET_LANGUAGE}.
When formatting the answer, first output the transcription in {SOURCE_LANGUAGE}, then one newline, then output the string '{TARGET_LANGUAGE}: ', then the translation in {TARGET_LANGUAGE}.

7. 媒体长度限制

  • 音频:最大支持30秒
  • 视频:按每秒1帧处理,最大支持60秒

适用场景

内容创作与通信

  • 文本生成:创意内容(诗歌、脚本)、代码、营销文案、邮件草稿
  • 对话AI:客服聊天机器人、虚拟助手
  • 文本摘要:长文档、研究论文摘要生成
  • 图像数据提取:视觉信息转文本
  • 音频交互:语音识别、语音翻译(E2B/E4B)

研究与教育

  • NLP/VLM研究:模型微调、算法开发
  • 语言学习:语法纠正、写作练习
  • 知识探索:文献分析、主题问答

限制说明

  • 训练数据影响:数据质量与多样性决定模型能力,可能存在偏见或知识缺口
  • 任务复杂度:开放式或高度复杂任务表现可能受限,清晰提示可提升效果
  • 语言理解局限:对歧义、讽刺、比喻等语言细微差别理解能力有限
  • 事实准确性:非知识库,可能生成过时或错误信息
  • 常识推理:依赖统计模式,部分场景缺乏常识判断能力

伦理与安全

Gemma 4经过与Google Gemini模型同等严格的安全评估,符合Google AI原则,针对以下风险进行控制:

  • 儿童性虐待材料与剥削内容
  • 危险内容(自残、伤害指导)
  • 性 explicit内容
  • 仇恨言论与骚扰内容

评估结果显示,Gemma 4在内容安全各维度显著优于前代模型,同时保持低不合理拒绝率,所有测试均在无安全过滤器条件下进行,验证了模型原生安全能力。

模型数据说明

训练数据集

包含网络文档(140+语言)、代码、数学文本、图像、音频等多模态数据,截止日期2025年1月,确保模型接触广泛领域知识。

数据预处理

  • CSAM过滤:多阶段严格过滤有害内容
  • 敏感数据过滤:自动化技术移除个人信息
  • 质量安全过滤:遵循Google内容政策进行内容筛选

伦理考量

  • 偏差缓解:通过数据预处理和评估减少社会文化偏差影响
  • 滥用防范:提供负责任使用指南(参见Responsible Generative AI Toolkit)
  • 透明度:公开模型架构、能力与限制信息
  • 隐私保护:训练数据过滤个人敏感信息,建议部署时采用隐私保护技术

Gemma 4系列模型在提供高性能多模态能力的同时,致力于推动负责任的AI开发与应用,为开发者和研究人员提供安全可靠的开源模型基础。

查看更多 gemma4-safetensors 相关镜像 →

ai/gemma4 logo

ai/gemma4

Docker AI 官方镜像
Gemma 4是Google DeepMind开发的多模态开源AI模型系列,支持文本、图像、音频处理,优化了推理、编码能力和长上下文处理,提供E2B、E4B、26B A4B、31B四种尺寸,适用于从移动设备到服务器的多样化部署场景。
16 次收藏1万+ 次下载
9 天前更新
ai/glm-5-safetensors logo

ai/glm-5-safetensors

Docker AI 官方镜像
744B MoE language model with 40B active params for reasoning, coding, and agentic tasks (FP8)
3 次收藏9.5千+ 次下载
1 个月前更新
ai/qwen3.5-safetensors logo

ai/qwen3.5-safetensors

Docker AI 官方镜像
3970亿参数的混合专家(MoE)多模态大语言模型,仅激活170亿参数实现高效推理,支持262K原生上下文(可扩展至100万),支持201种语言和图像输入,适用于企业级复杂任务如文档分析、多轮对话和agent工作流。
1 次收藏1万+ 次下载
18 天前更新
ai/qwen3.6-safetensors logo

ai/qwen3.6-safetensors

Docker AI 官方镜像
Qwen3.6-35B-A3B是阿里云Qwen开发的多模态大语言模型,具备350亿总参数(30亿激活参数),融合视觉与语言理解能力,专注于编码、智能体任务及视觉语言理解,提供高效推理与扩展上下文支持。
171 次下载
21 小时前更新
lisp19/vllm-gemma4 logo

lisp19/vllm-gemma4

lisp19
vllm的分支版本,专门优化以更好地在Turing架构上与Gemma4模型协同工作。
508 次下载
22 小时前更新

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

Docker 配置

登录仓库拉取

通过 Docker 登录认证访问私有仓库

专属域名拉取

无需登录使用专属域名

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

Harbor 镜像源配置

Harbor Proxy Repository 对接专属域名

Portainer 镜像源配置

Portainer Registries 加速拉取

Nexus 镜像源配置

Nexus3 Docker Proxy 内网缓存

系统配置

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

MacOS OrbStack

MacOS OrbStack 容器配置

Docker Compose

Docker Compose 项目配置

NAS 设备

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

极空间

极空间 NAS 系统配置服务

网络设备

爱快路由

爱快 iKuai 路由系统配置

宝塔面板

在宝塔面板一键配置镜像

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

使用与功能问题

配置了专属域名后,docker search 为什么会报错?

docker search 限制

Docker Hub 上有的镜像,为什么在轩辕镜像网站搜不到?

站内搜不到镜像

机器不能直连外网时,怎么用 docker save / load 迁镜像?

离线 save/load

docker pull 拉插件报错(plugin v1+json)怎么办?

插件要用 plugin install

WSL 里 Docker 拉镜像特别慢,怎么排查和优化?

WSL 拉取慢

轩辕镜像安全吗?如何用 digest 校验镜像没被篡改?

安全与 digest

第一次用轩辕镜像拉 Docker 镜像,要怎么登录和配置?

新手拉取配置

错误码与失败问题

docker pull 提示 manifest unknown 怎么办?

manifest unknown

docker pull 提示 no matching manifest 怎么办?

no matching manifest(架构)

镜像已拉取完成,却提示 invalid tar header 或 failed to register layer 怎么办?

invalid tar header(解压)

Docker pull 时 HTTPS / TLS 证书验证失败怎么办?

TLS 证书失败

Docker pull 时 DNS 解析超时或连不上仓库怎么办?

DNS 超时

Docker 拉取出现 410 Gone 怎么办?

410 Gone 排查

出现 402 或「流量用尽」提示怎么办?

402 与流量用尽

Docker 拉取提示 UNAUTHORIZED(401)怎么办?

401 认证失败

遇到 429 Too Many Requests(请求太频繁)怎么办?

429 限流

docker login 提示 Cannot autolaunch D-Bus,还算登录成功吗?

D-Bus 凭证提示

为什么会出现「单层超过 20GB」或 413,无法加速拉取?

413 与超大单层

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别?

免费版与专业版区别

轩辕镜像支持哪些 Docker 镜像仓库?

支持的镜像仓库

镜像拉取失败还会不会扣流量?

失败是否计费

麒麟 V10 / 统信 UOS 提示 KYSEC 权限不够怎么办?

KYSEC 拦截脚本

如何在轩辕镜像申请开具发票?

申请开票

怎么修改轩辕镜像的网站登录和仓库登录密码?

修改登录密码

如何注销轩辕镜像账户?要注意什么?

注销账户

配置与原理类

写了 registry-mirrors,为什么还是走官方或仍然报错?

mirrors 不生效

怎么用 docker tag 去掉镜像名里的轩辕域名前缀?

去掉域名前缀

如何拉取指定 CPU 架构的镜像(如 ARM64、AMD64)?

指定架构拉取

用轩辕镜像拉镜像时快时慢,常见原因有哪些?

拉取速度原因

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
Docker AI 官方镜像
...
ai/gemma4-safetensors
博客公告Docker 镜像公告与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
镜像拉取问题咨询请 提交工单,官方技术交流群:1072982923。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
镜像拉取问题咨询请提交工单,官方技术交流群:。轩辕镜像所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
商务合作:点击复制邮箱
©2024-2026 源码跳动
商务合作:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.