本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

!logo
Qwen3 是 Qwen 大语言模型系列的最新一代产品,专注于在编码、数学、推理及语言任务中提供高性能表现。该模型包含密集型和混合专家(MoE)两种架构,可灵活部署于轻量化应用到大规模研究场景。
Qwen3 引入双推理模式:“思考模式”适用于复杂任务,“非思考模式”适用于快速响应,让用户能灵活调整模型性能。相比前代模型,它在推理能力、指令遵循、代码生成上表现更优,同时擅长创意写作和对话交互。此外,Qwen3 具备强大的代理能力与工具使用功能,支持超 100 种语言,适合多语言、多领域应用场景。
| 属性 | 说明 |
|---|---|
| 提供者 | 阿里云 |
| 架构 | qwen3 |
| 数据截止日期 | 2025年4月(预计) |
| 支持语言 | 119种语言,涵盖印欧语系、汉藏语系、闪含语系、南岛语系、达罗毗荼语系、突厥语系、侗台语系、乌拉尔语系、南亚语系等,包括日语、巴斯克语、海地克里奥尔语等 |
| 工具调用 | 支持 |
| 输入模态 | 文本 |
| 输出模态 | 文本 |
| 许可证 | Apache 2.0 |
| 模型变体 | 参数规模 | 量化方式 | 上下文窗口 | 显存需求¹ | 大小 |
|---|---|---|---|---|---|
ai/qwen3:latestai/qwen3:8B-Q4_K_M | 80亿 | IQ2_XXS/Q4_K_M | 41K tokens | 5.49 GiB | 4.68 GB |
ai/qwen3:0.6B-Q4_0 | 0.6亿 | Q4_0 | 41K tokens | 1.22 GiB | 441.67 MB |
ai/qwen3:0.6B-Q4_K_M | 0.6亿 | IQ2_XXS/Q4_K_M | 41K tokens | 1.23 GiB | 456.11 MB |
ai/qwen3:0.6B-F16 | 0.6亿 | F16 | 41K tokens | 1.98 GiB | 1.40 GB |
ai/qwen3:30B-A3B-F16 | 300亿(A3B) | F16 | 41K tokens | 57.25 GiB | 56.89 GB |
ai/qwen3:30B-A3B-Q4_K_M | 300亿(A3B) | IQ2_XXS/Q4_K_M | 41K tokens | 18.05 GiB | 17.28 GB |
ai/qwen3:8B-Q4_0 | 80亿 | Q4_0 | 41K tokens | 5.26 GiB | 4.44 GB |
ai/qwen3:8B-Q4_K_M | 80亿 | IQ2_XXS/Q4_K_M | 41K tokens | 5.49 GiB | 4.68 GB |
ai/qwen3:8B-F16 | 80亿 | F16 | 41K tokens | 15.24 GiB | 15.26 GB |
ai/qwen3:14B-Q6_K | 140亿 | IQ1_S/Q6_K | 41K tokens | 11.96 GiB | 11.28 GB |
¹:显存需求基于模型特性估算。
latest标签对应8B-Q4_K_M变体。
Qwen3-8B 设计用于多种高级自然语言处理任务,核心能力包括:
enable_thinking=True 后,可通过 /think 和 /no_think 提示词触发软切换,在多轮对话中灵活控制模型推理深度。命名规则更新:Qwen3 模型采用新命名规则,微调模型不再包含
-Instruct后缀(如Qwen3-32B替代Qwen2.5-32B-Instruct),基础模型需添加-Base后缀。
docker model pull ai/qwen3
docker model run ai/qwen3
更多细节可参考 Docker Model Runner 文档。
| 任务类别 | 测试基准 | Qwen3 得分 |
|---|---|---|
| 通用任务 | MMLU | 87.81 |
| MMLU-Redux | 87.40 | |
| MMLU-Pro | 68.18 | |
| SuperGPQA | 44.06 | |
| BBH | 88.87 | |
| 数学与科学任务 | GPQA | 47.47 |
| GSM8K | 94.39 | |
| MATH | 71.84 | |
| 多语言任务 | MGSM | 83.53 |
| MMMLU | 86.70 | |
| INCLUDE | 73.46 | |
| 代码任务 | EvalPlus | 77.60 |
| MultiPL-E | 65.94 | |
| MBPP | 81.40 | |
| CRUX-O | 79.00 |
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429