
Mistral Small 4是一款功能强大的混合模型,既能作为通用指令模型,也能作为推理模型。它将三大模型家族——Instruct、Reasoning(前称Magistral)和Devstral的能力统一到单一模型中。
该模型拥有1190亿参数,采用稀疏混合专家架构,每token仅激活65亿参数,在提供卓越性能的同时保持了出色的效率。模型具备多模态能力,可接受文本和图像输入并生成文本输出,支持高达100万token的上下文窗口。
在延迟优化配置下,Mistral Small 4实现了40%的端到端完成时间 reduction;在吞吐量优化配置下,与Mistral Small 3相比,每秒可处理3倍以上请求。模型提供灵活的推理模式——用户可在快速即时回复模式和深度推理模式之间切换,以便在需要时通过测试时计算提升性能。
| 属性 | 值 |
|---|---|
| 提供商 | Mistral AI |
| 架构 | Mistral4(MoE:128个专家,4个活跃) |
| 参数 | 总计1190亿,每token激活65亿 |
| 知识截止日期 | 2024年11月1日 |
| 支持语言 | 阿拉伯语、英语、法语、西班牙语、德语、意大利语、葡萄牙语、荷兰语、日语、韩语、中文 |
| 输入模态 | 文本、图像 |
| 输出模态 | 文本 |
| 上下文长度 | 1,048,576 token(100万) |
| 许可证 | Apache 2.0 |
bashdocker model run mistral-small4
更多信息,请查看Docker Model Runner文档。
Mistral Small 4支持每个请求的reasoning_effort参数,允许用户在快速响应(reasoning_effort="none")和深度逐步推理(reasoning_effort="high")之间选择。
!内部基准测试比较
推理模式性能
!推理基准测试比较
启用推理功能的Mistral Small 4取得了具有竞争力的分数,在多个基准测试中匹配或超越GPT-OSS 120B,同时生成的输出显著更短。在AA LCR上,Mistral Small 4仅用1.6K字符就获得0.72分,而Qwen模型需要3.5-4倍的输出量(5.8-6.1K字符)才能达到相当性能。这种效率降低了延迟、推理成本,并改善了用户体验。
AA LCR(LiveCodeBench推理)
!LCR基准测试
LiveCodeBench
!LiveCodeBench结果
AIME 2025
!AIME25基准测试
Mistral Small 4适用于广泛的应用场景:
reasoning_effort="high")会生成包含明确思考步骤的较长输出,可能会影响需要即时响应的应用的延迟此模型卡片由https://github.com/docker/cagent-action%E8%87%AA%E5%8A%A8%E7%94%9F%E6%88%90%E3%80%82 想了解更多关于Docker Model Runner的信息?查看项目仓库:https://github.com/docker/model-runner%E3%80%82
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。






探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务