本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

qwen3 Docker 镜像下载 - 轩辕镜像

qwen3 镜像详细信息和使用指南

qwen3 镜像标签列表和版本信息

qwen3 镜像拉取命令和加速下载

qwen3 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

qwen3
ai/qwen3

qwen3 镜像详细信息

qwen3 镜像标签列表

qwen3 镜像使用说明

qwen3 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

Qwen3是通义千问系列最新推出的大语言模型,作为新一代人工智能技术成果,它专为顶尖级代码编写、数学计算、逻辑推理及语言处理任务打造,凭借先进的算法架构与深度优化的模型性能,能够高效应对多领域复杂场景下的专业需求,为用户提供精准、智能的解决方案,展现出在技术研发与应用落地中的卓越潜力。
76 收藏0 次下载activeai

qwen3 镜像详细说明

qwen3 使用指南

qwen3 配置说明

qwen3 官方文档

Qwen3

!logo

Qwen3 是 Qwen 大语言模型系列的最新一代产品,专注于在编码、数学、推理及语言任务中提供高性能表现。该模型包含密集型和混合专家(MoE)两种架构,可灵活部署于轻量化应用到大规模研究场景。

Qwen3 引入双推理模式:“思考模式”适用于复杂任务,“非思考模式”适用于快速响应,让用户能灵活调整模型性能。相比前代模型,它在推理能力、指令遵循、代码生成上表现更优,同时擅长创意写作和对话交互。此外,Qwen3 具备强大的代理能力与工具使用功能,支持超 100 种语言,适合多语言、多领域应用场景。

📌 特性

属性说明
提供者阿里云
架构qwen3
数据截止日期2025年4月(预计)
支持语言119种语言,涵盖印欧语系、汉藏语系、闪含语系、南岛语系、达罗毗荼语系、突厥语系、侗台语系、乌拉尔语系、南亚语系等,包括日语、巴斯克语、海地克里奥尔语等
工具调用支持
输入模态文本
输出模态文本
许可证Apache 2.0

可用模型变体

模型变体参数规模量化方式上下文窗口显存需求¹大小
ai/qwen3:latest

ai/qwen3:8B-Q4_K_M
80亿IQ2_XXS/Q4_K_M41K tokens5.49 GiB4.68 GB
ai/qwen3:0.6B-Q4_00.6亿Q4_041K tokens1.22 GiB441.67 MB
ai/qwen3:0.6B-Q4_K_M0.6亿IQ2_XXS/Q4_K_M41K tokens1.23 GiB456.11 MB
ai/qwen3:0.6B-F160.6亿F1641K tokens1.98 GiB1.40 GB
ai/qwen3:30B-A3B-F16300亿(A3B)F1641K tokens57.25 GiB56.89 GB
ai/qwen3:30B-A3B-Q4_K_M300亿(A3B)IQ2_XXS/Q4_K_M41K tokens18.05 GiB17.28 GB
ai/qwen3:8B-Q4_080亿Q4_041K tokens5.26 GiB4.44 GB
ai/qwen3:8B-Q4_K_M80亿IQ2_XXS/Q4_K_M41K tokens5.49 GiB4.68 GB
ai/qwen3:8B-F1680亿F1641K tokens15.24 GiB15.26 GB
ai/qwen3:14B-Q6_K140亿IQ1_S/Q6_K41K tokens11.96 GiB11.28 GB

¹:显存需求基于模型特性估算。

latest 标签对应 8B-Q4_K_M 变体。

预期用途

Qwen3-8B 设计用于多种高级自然语言处理任务,核心能力包括:

  • 架构支持:兼容密集型和混合专家(MoE)模型架构,提供 0.6亿、17亿、40亿、80亿、140亿、320亿参数规模,以及 300亿(A3B)、2350亿(A22B)等大型 MoE 变体。
  • 双模式切换:可在对话中动态调整推理模式
    • 思考模式:优化复杂逻辑推理、数学计算和代码生成场景;
    • 非思考模式:适用于高效的通用对话交互。
  • 推理性能提升:在数学、代码生成和常识推理基准测试中,性能超过前代 QwQ(思考模式)和 Qwen2.5-Instruct(非思考模式)模型。
  • 人类对齐能力:擅长创意写作、角色扮演、多轮对话和指令遵循,支持沉浸式交互。
  • 代理能力:集成外部工具的能力突出,在复杂代理工作流中表现优异(覆盖思考/非思考模式)。
  • 多语言支持:覆盖 100+ 语言及方言,具备稳定的多语言指令遵循和翻译能力。

注意事项

  • 思考模式切换
    启用 enable_thinking=True 后,可通过 /think/no_think 提示词触发软切换,在多轮对话中灵活控制模型推理深度。
  • 工具调用与 Qwen-Agent
    处理代理任务时,建议使用 Qwen-Agent:通过内置模板和解析器简化外部工具集成,减少手动处理工具调用的工作量。

命名规则更新:Qwen3 模型采用新命名规则,微调模型不再包含 -Instruct 后缀(如 Qwen3-32B 替代 Qwen2.5-32B-Instruct),基础模型需添加 -Base 后缀。

使用 Docker Model Runner 运行模型

步骤 1:拉取模型

bash
docker model pull ai/qwen3

步骤 2:运行模型

bash
docker model run ai/qwen3

更多细节可参考 Docker Model Runner 文档。

基准测试结果

任务类别测试基准Qwen3 得分
通用任务MMLU87.81
MMLU-Redux87.40
MMLU-Pro68.18
SuperGPQA44.06
BBH88.87
数学与科学任务GPQA47.47
GSM8K94.39
MATH71.84
多语言任务MGSM83.53
MMMLU86.70
INCLUDE73.46
代码任务EvalPlus77.60
MultiPL-E65.94
MBPP81.40
CRUX-O79.00

相关链接

  • Qwen3:深入思考,快速响应

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

oldzhang的头像

oldzhang

运维工程师

Linux服务器

5

"Docker加速体验非常流畅,大镜像也能快速完成下载。"