
ai/deepseek-v3.2-vllm!logo
我们推出DeepSeek-V3.2,这是一款兼顾高计算效率与卓越推理及智能体性能的模型。该模型基于三项关键技术突破构建:
DeepSeek稀疏注意力(DSA):引入DSA这一高效注意力机制,在保持模型性能的同时大幅降低计算复杂度,专为长上下文场景优化。
可扩展强化学习框架:通过实施稳健的强化学习协议并扩展训练后计算量,DeepSeek-V3.2性能可与GPT-5媲美。值得注意的是,高计算量变体DeepSeek-V3.2-Speciale超越GPT-5,推理能力与Gemini-3.0-Pro相当。
大规模智能体任务合成管道:为将推理能力融入工具使用场景,我们开发了新型合成管道,可系统化生成大规模训练数据。这支持可扩展的智能体训练后优化,提升复杂交互式环境中的合规性与泛化能力。
成就:🥇 荣获2025年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)金牌。
!benchmark
bashdocker model run deepseek-v3.2-vllm
有关Docker Model Runner的更多信息,请查阅文档。






manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务