由DeepSeek开发的蒸馏版LLaMA模型,快速且针对实际任务优化,适用于高效执行各类真实场景任务。
收藏数: 76
下载次数: 175548
类型:

ai/deepseek-r1-distill-llamaDeepseek-R1-Distill-Llama 是 DeepSeek 推出的基于 LLaMA 架构的蒸馏版推理模型,是 DeepSeek 第一代推理模型(DeepSeek-R1-Zero 和 DeepSeek-R1)的衍生版本。该模型通过强化学习增强推理性能,在完整 DeepSeek-R1 模型的响应和推理输出上进行了微调优化,具有快速高效的特点,专为实际业务场景中的任务处理设计。
| 属性 | 详情 |
|---|---|
| 提供方 | Deepseek |
| 架构 | LLaMA |
| 数据截止日期 | 2024年5月ⁱ |
| 支持语言 | 英语、中文 |
| 工具调用能力 | ✅(支持) |
| 输入模态 | 文本 |
| 输出模态 | 文本 |
| 许可证 | MIT |
ⁱ:估算值
| 模型变体 | 参数 | 量化方式 | 上下文窗口 | 显存¹ | 大小 |
|---|---|---|---|---|---|
ai/deepseek-r1-distill-llama:latestai/deepseek-r1-distill-llama:8B-Q4_K_M | 8B | IQ2_XXS/Q4_K_M | 131K tokens | 5.33 GiB | 4.58 GB |
ai/deepseek-r1-distill-llama:8B-Q4_0 | 8B | Q4_0 | 131K tokens | 5.09 GiB | 4.33 GB |
ai/deepseek-r1-distill-llama:8B-Q4_K_M | 8B | IQ2_XXS/Q4_K_M | 131K tokens | 5.33 GiB | 4.58 GB |
ai/deepseek-r1-distill-llama:8B-F16 | 8B | F16 | 131K tokens | 15.01 GiB | 14.96 GB |
ai/deepseek-r1-distill-llama:70B-Q4_0 | 70B | Q4_0 | 131K tokens | 38.73 GiB | 37.22 GB |
ai/deepseek-r1-distill-llama:70B-Q4_K_M | 70B | IQ2_XXS/Q4_K_M | 131K tokens | 41.11 GiB | 39.59 GB |
¹:显存基于模型特性估算。
说明:
latest标签对应8B-Q4_K_M变体。
Deepseek-R1-Distill-Llama 适用于以下场景:
确保已安装支持 Model Runner 功能的 Docker 环境,详情参考 Docker Model Runner 文档。
bashdocker model pull ai/deepseek-r1-distill-llama
bashdocker model run ai/deepseek-r1-distill-llama
| 类别 | 基准测试 | DeepSeek R1 |
|---|---|---|
| 英文任务 | ||
| MMLU (Pass@1) | 90.8 | |
| MMLU-Redux (EM) | 92.9 | |
| MMLU-Pro (EM) | 84.0 | |
| DROP (3-shot F1) | 92.2 | |
| IF-Eval (Prompt Strict) | 83.3 | |
| GPQA-Diamond (Pass@1) | 71.5 | |
| SimpleQA (Correct) | 30.1 | |
| FRAMES (Acc.) | 82.5 | |
| AlpacaEval2.0 (LC-winrate) | 87.6 | |
| ArenaHard (GPT-4-1106) | 92.3 | |
| 代码任务 | ||
| LiveCodeBench (Pass@1-COT) | 65.9 | |
| Codeforces (Percentile) | 96.3 | |
| Codeforces (Rating) | 2029 | |
| SWE Verified (Resolved) | 49.2 | |
| Aider-Polyglot (Acc.) | 53.3 | |
| 数学任务 | ||
| AIME 2024 (Pass@1) | 79.8 | |
| MATH-500 (Pass@1) | 97.3 | |
| CNMO 2024 (Pass@1) | 78.8 | |
| 中文任务 | ||
| CLUEWSC (EM) | 92.8 | |
| C-Eval (EM) | 91.8 | |
| C-SimpleQA (Correct) | 63.7 |
以下是 ai/deepseek-r1-distill-llama 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。





manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务