
ai/granite-4.0-h-nano!logo
Granite-4.0-H-1B和granite-4.0-h-350M是轻量级指令模型,基于Granite-4.0-H-1B-Base和Granite-4.0-H-350M-Base基础模型微调而来,使用了具有宽松许可的开源指令数据集与内部收集的合成数据集的组合。该模型通过监督微调、强化学习和模型合并等多种技术开发。
| 属性 | 详情 |
|---|---|
| 提供者 | Granite团队,IBM |
| 架构 | granitehybrid |
| 数据截止日期 | 未披露 |
| 支持语言 | 英语、德语、西班牙语、法语、日语、葡萄牙语、阿拉伯语、捷克语、意大利语、韩语、荷兰语、中文(可通过微调扩展) |
| 工具调用 | ✅ |
| 输入模态 | 文本 |
| 输出模态 | 文本 |
| 许可证 | Apache 2.0 |
Granite 4.0 Nano指令模型具备强大的指令遵循能力,将先进AI能力带入设备端部署和研究用例。此外,其紧凑的尺寸使其非常适合在专业领域进行微调,无需大量计算资源。
| 模型变体 | 参数 | 量化方式 | 上下文窗口 | 显存¹ | 大小 |
|---|---|---|---|---|---|
ai/granite-4.0-h-nano:1Bai/granite-4.0-h-nano:1B-Q8_0ai/granite-4.0-h-nano:latest | 10亿 | MOSTLY_Q8_0 | 100万tokens | 1.92 GiB | 1.45 GB |
ai/granite-4.0-h-nano:350M-Q8_0 | 3.5亿 | MOSTLY_Q8_0 | 100万tokens | 0.76 GiB | 345.83 MB |
¹:显存基于模型特性估算。
latest→1B
bashdocker model run ai/granite-4.0-h-nano
| 基准测试 | 指标 | 350M Dense | H 350M Dense | 1B Dense | H 1B Dense |
|---|---|---|---|---|---|
| 通用任务 | |||||
| MMLU | 5-shot | 35.01 | 36.21 | 59.39 | 59.74 |
| MMLU-Pro | 5-shot, CoT | 12.13 | 14.38 | 34.02 | 32.86 |
| BBH | 3-shot, CoT | 33.07 | 33.28 | 60.37 | 59.68 |
| AGI EVAL | 0-shot, CoT | 26.22 | 29.61 | 49.22 | 52.44 |
| GPQA | 0-shot, CoT | 24.11 | 26.12 | 29.91 | 29.69 |
| 对齐任务 | |||||
| IFEval | Instruct, Strict | 61.63 | 67.63 | 80.82 | 82.37 |
| IFEval | Prompt, Strict | 49.17 | 55.64 | 73.94 | 74.68 |
| IFEval | Average | 55.40 | 61.63 | 77.38 | 78.53 |
| 数学任务 | |||||
| GSM8K | 8-shot | 30.71 | 39.27 | 76.35 | 69.83 |
| GSM Symbolic | 8-shot | 26.76 | 33.70 | 72.30 | 65.72 |
| Minerva Math | 0-shot, CoT | 13.04 | 5.76 | 45.28 | 49.40 |
| DeepMind Math | 0-shot, CoT | 8.45 | 6.20 | 34.00 | 34.98 |
| 代码任务 | |||||
| HumanEval | pass@1 | 39.00 | 38.00 | 74.00 | 73.00 |
| HumanEval+ | pass@1 | 37.00 | 35.00 | 69.00 | 68.00 |
| MBPP | pass@1 | 48.00 | 49.00 | 65.00 | 69.00 |
| MBPP+ | pass@1 | 38.00 | 44.00 | 57.00 | 60.00 |
| CRUXEval-O | pass@1 | 23.75 | 25.50 | 33.13 | 36.00 |
| BigCodeBench | pass@1 | 11.14 | 11.23 | 30.18 | 29.12 |
| 工具调用任务 | |||||
| BFCL v3 | — | 39.32 | 43.32 | 54.82 | 50.21 |
| 多语言任务 | |||||
| MULTIPLE | pass@1 | 15.99 | 14.31 | 32.24 | 36.11 |
| MMMLU | 5-shot | 28.23 | 27.95 | 45.00 | 49.43 |
| INCLUDE | 5-shot | 27.74 | 27.09 | 42.12 | 43.35 |
| MGSM | 8-shot | 14.72 | 16.16 | 37.84 | 27.52 |
| 安全性 | |||||
| SALAD-Bench | — | 97.12 | 96.55 | 93.44 | 96.40 |
| AttaQ | — | 82.53 | 81.76 | 85.26 | 82.85 |




探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
manifest unknown
TLS 证书失败
DNS 超时
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务