ghcr.io/ggml-org/llama.cpp:light-vulkan-b8660 Docker 镜像 |...

ghcr.io

ghcr.iolinux/amd64light-vulkan-b8660大小: 未知更新于 2026年4月5日

llama.cpp是一款轻量高效的LLM推理工具，旨在通过极简配置在各类硬件上实现高性能本地及云端LLM推理。

无依赖C/C++原生实现；多硬件架构深度优化，包括Apple silicon（ARM NEON/Accelerate/Metal）、x86（AVX/AVX2/AVX512/AMX）及RISC-V（RVV等）；支持1.5-bit至8-bit整数量化以降低内存占用并加速推理；提供CUDA（NVIDIA GPU）、HIP（AMD GPU）、MUSA（摩尔线程GPU）及Vulkan/SYCL后端支持；支持CPU+GPU混合推理以处理超显存容量模型。

基于C/C++构建，核心依赖ggml库，集成多架构硬件加速指令集，通过自定义内核及多后端（CUDA/HIP/MUSA/Vulkan/SYCL）实现跨平台高性能计算。

适用于本地LLM应用开发、边缘设备部署、云端低延迟推理服务及多硬件环境下的模型测试验证，支持LLaMA系列、Mistral、Mixtral等主流LLM模型。

ghcr.io/ggml-org/llama.cpp:light-vulkan-b8660

拉取命令

专属域名未获取到

更多版本

轩辕镜像配置手册

Docker 配置

登录仓库拉取

专属域名拉取

K8s Containerd

K3s

Dev Containers

Podman

Singularity/Apptainer

其他仓库配置

Harbor 镜像源配置

Portainer 镜像源配置

Nexus 镜像源配置

系统配置

Linux

Windows/Mac

MacOS OrbStack

Docker Compose

NAS 设备

群晖

飞牛

绿联

威联通

极空间

网络设备

爱快路由

宝塔面板

镜像拉取常见问题

使用与功能问题

配置了专属域名后，docker search 为什么会报错？

Docker Hub 上有的镜像，为什么在轩辕镜像网站搜不到？

机器不能直连外网时，怎么用 docker save / load 迁镜像？

docker pull 拉插件报错（plugin v1+json）怎么办？

WSL 里 Docker 拉镜像特别慢，怎么排查和优化？

轩辕镜像安全吗？如何用 digest 校验镜像没被篡改？

第一次用轩辕镜像拉 Docker 镜像，要怎么登录和配置？

错误码与失败问题

docker pull 提示 manifest unknown 怎么办？

docker pull 提示 no matching manifest 怎么办？

镜像已拉取完成，却提示 invalid tar header 或 failed to register layer 怎么办？

Docker pull 时 HTTPS / TLS 证书验证失败怎么办？

Docker pull 时 DNS 解析超时或连不上仓库怎么办？

Docker 拉取出现 410 Gone 怎么办？

出现 402 或「流量用尽」提示怎么办？

Docker 拉取提示 UNAUTHORIZED（401）怎么办？

遇到 429 Too Many Requests（请求太频繁）怎么办？

docker login 提示 Cannot autolaunch D-Bus，还算登录成功吗？

为什么会出现「单层超过 20GB」或 413，无法加速拉取？

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别？

轩辕镜像支持哪些 Docker 镜像仓库？

镜像拉取失败还会不会扣流量？

麒麟 V10 / 统信 UOS 提示 KYSEC 权限不够怎么办？

如何在轩辕镜像申请开具发票？

怎么修改轩辕镜像的网站登录和仓库登录密码？

如何注销轩辕镜像账户？要注意什么？

配置与原理类

写了 registry-mirrors，为什么还是走官方或仍然报错？

怎么用 docker tag 去掉镜像名里的轩辕域名前缀？

如何拉取指定 CPU 架构的镜像（如 ARM64、AMD64）？

用轩辕镜像拉镜像时快时慢，常见原因有哪些？

用户好评