
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Qwen3-Coder-30B-A3B-Instruct是阿里云Qwen团队开发的最先进编码模型。这款精简的混合专家(MoE)模型在智能编码、浏览器自动化和基础编码任务中表现出色,同时通过稀疏激活保持高效性。该模型总参数30.5B,仅激活3.3B参数,在实现卓越性能的同时保持计算效率。
该模型擅长工具调用和函数执行,非常适合需要代码生成与外部工具和API交互的智能工作流。它原生支持256K tokens的上下文窗口(使用Yarn可扩展至1M tokens),能够实现仓库级代码理解和生成。Qwen3-Coder专为与CLINE等平台无缝协作设计,并针对智能编码场景提供了特殊设计的函数调用格式。
作为非思考模式模型,它直接生成代码响应,不包含中间推理块,非常适合需要简洁、即时代码输出的生产环境。支持对话界面,能处理复杂的多轮编码对话,并在长交互过程中保持上下文。
| 属性 | 值 |
|---|---|
| 提供者 | Qwen(阿里云) |
| 架构 | Qwen3 MoE(混合专家) |
| 语言 | 多语言 |
| 输入模态 | 文本 |
| 输出模态 | 文本 |
| 上下文长度 | 262,144 tokens(使用Yarn可扩展至1M) |
| 参数 | 总30.5B,激活3.3B |
| 层数 | 48 |
| 注意力头 | 32(Q),4(KV)- 分组查询注意力 |
| 专家数量 | 共128个,激活8个 |
| 许可证 | Apache 2.0 |
!Qwen3-Coder架构
Qwen3-Coder采用混合专家(MoE)架构,包含128个专家网络,每个token仅激活8个专家。这种稀疏激活模式使模型能够保持较大的总参数规模,同时通过选择性激活控制计算成本。
内置工具调用能力,采用专门的函数调用格式,可在Qwen Code和CLINE等多个平台上工作。模型能无缝集成外部工具和API。
原生支持262K token上下文窗口,使用Yarn技术可扩展至100万token。支持全面的仓库级代码分析和生成。
53>
在浏览器使用任务上表现出色,支持自动化Web交互和测试工作流。
支持多多轮对话并保持上下文,众志成,非常适合交互式编码助手和结对编程场景。
直接生成代码输出,不包含中间推理步骤,针对需要简洁、即时响应的生产用例优化。
bashdocker model run qwen3-coder
更多信息,请查看Docker Model Runner文档。
为获得最佳性能,建议使用以下参数:
transformers>=4.51.0以正确加载模型(早期版本会导致KeyError: 'qwen3_moe')您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务
以下是 aistaging/qwen3-coder 相关的常用 Docker 镜像,适用于 不同场景 等不同场景: