
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
!https://github.com/docker/model-cards/raw/refs/heads/main/logos/ibm-280x184-overview.svg
Granite-4.0-H-1B和granite-4.0-h-350M是轻量级指令模型,基于Granite-4.0-H-1B-Base和Granite-4.0-H-350M-Base基础模型微调而来,使用了具有宽松许可的开源指令数据集与内部收集的合成数据集的组合。该模型通过监督微调、强化学习和模型合并等多种技术开发。
| 属性 | 详情 |
|---|---|
| 提供者 | Granite团队,IBM |
| 架构 | granitehybrid |
| 数据截止日期 | 未披露 |
| 支持语言 | 英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语、中文(可通过微调扩展) |
| 工具调用 | ✅ |
| 输入模态 | 文本 |
| 输出模态 | 文本 |
| 许可证 | Apache 2.0 |
Granite 4.0 Nano指令模型具备强大的指令遵循能力,将先进AI能力带入设备端部署和研究用例。此外,其紧凑的尺寸使其非常适合在专业领域进行微调,无需大量计算资源。
| 模型变体 | 参数 | 量化方式 | 上下文窗口 | 显存¹ | 大小 |
|---|---|---|---|---|---|
ai/granite-4.0-h-nano:1Bai/granite-4.0-h-nano:1B-Q8_0ai/granite-4.0-h-nano:latest | 10亿 | MOSTLY_Q8_0 | 100万tokens | 1.92 GiB | 1.45 GB |
ai/granite-4.0-h-nano:350M-Q8_0 | 3.5亿 | MOSTLY_Q8_0 | 100万tokens | 0.76 GiB | 345.83 MB |
¹:显存基于模型特性估算。
latest→1B
bashdocker model run ai/granite-4.0-h-nano
| 基准测试 | 指标 | 350M Dense | H 350M Dense | 1B Dense | H 1B Dense |
|---|---|---|---|---|---|
| 通用任务 | |||||
| MMLU | 5-shot | 35.01 | 36.21 | 59.39 | 59.74 |
| MMLU-Pro | 5-shot, CoT | 12.13 | 14.38 | 34.02 | 32.86 |
| BBH | 3-shot, CoT | 33.07 | 33.28 | 60.37 | 59.68 |
| AGI EVAL | 0-shot, CoT | 26.22 | 29.61 | 49.22 | 52.44 |
| GPQA | 0-shot, CoT | 24.11 | 26.12 | 29.91 | 29.69 |
| 对齐任务 | |||||
| IFEval | Instruct, Strict | 61.63 | 67.63 | 80.82 | 82.37 |
| IFEval | Prompt, Strict | 49.17 | 55.64 | 73.94 | 74.68 |
| IFEval | Average | 55.40 | 61.63 | 77.38 | 78.53 |
| 数学任务 | |||||
| GSM8K | 8-shot | 30.71 | 39.27 | 76.35 | 69.83 |
| GSM Symbolic | 8-shot | 26.76 | 33.70 | 72.30 | 65.72 |
| Minerva Math | 0-shot, CoT | 13.04 | 5.76 | 45.28 | 49.40 |
| DeepMind Math | 0-shot, CoT | 8.45 | 6.20 | 34.00 | 34.98 |
| 代码任务 | |||||
| HumanEval | pass@1 | 39.00 | 38.00 | 74.00 | 73.00 |
| HumanEval+ | pass@1 | 37.00 | 35.00 | 69.00 | 68.00 |
| MBPP | pass@1 | 48.00 | 49.00 | 65.00 | 69.00 |
| MBPP+ | pass@1 | 38.00 | 44.00 | 57.00 | 60.00 |
| CRUXEval-O | pass@1 | 23.75 | 25.50 | 33.13 | 36.00 |
| BigCodeBench | pass@1 | 11.14 | 11.23 | 30.18 | 29.12 |
| 工具调用任务 | |||||
| BFCL v3 | — | 39.32 | 43.32 | 54.82 | 50.21 |
| 多语言任务 | |||||
| MULTIPLE | pass@1 | 15.99 | 14.31 | 32.24 | 36.11 |
| MMMLU | 5-shot | 28.23 | 27.95 | 45.00 | 49.43 |
| INCLUDE | 5-shot | 27.74 | 27.09 | 42.12 | 43.35 |
| MGSM | 8-shot | 14.72 | 16.16 | 37.84 | 27.52 |
| 安全性 | |||||
| SALAD-Bench | — | 97.12 | 96.55 | 93.44 | 96.40 |
| AttaQ | — | 82.53 | 81.76 | 85.26 | 82.85 |
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务