
Ampere®优化版https://github.com/ollama/ollama Docker镜像。
该镜像可在裸金属Ampere® CPU和云环境中基于Ampere®的VM上运行。
为获得最佳效果,建议使用Ampere HuggingFace页面提供的自定义量化格式模型:Ampere's HuggingFace页面。
本镜像作为原版Ollama镜像的直接替代品,在保持与原版功能和行为完全兼容的同时,提供性能优化。适用于需要在Ampere®硬件上部署高效LLM推理服务的场景。
consoledocker run --privileged=true --name ollama -p 11434:11434 amperecomputingai/ollama:latest
在另一个终端中执行:
consoledocker exec -it ollama bash ollama run hf.co/AmpereComputing/llama-3.2-3b-instruct-gguf:Llama-3.2-3B-Instruct-Q8R16.gguf
拉取模型:
consolecurl http://localhost:11434/api/pull -d '{ "model": "hf.co/AmpereComputing/llama-3.2-3b-instruct-gguf:Llama-3.2-3B-Instruct-Q8R16.gguf" }'
生成文本:
consolecurl http://localhost:11434/api/generate -d '{ "model": "hf.co/AmpereComputing/llama-3.2-3b-instruct-gguf:Llama-3.2-3B-Instruct-Q8R16.gguf", "prompt":"为什么天空是蓝色的?" }'
Ampere®优化的Ollama支持Q4_K_4和Q8R16两种新量化方法,可从Ampere's HuggingFace页面下载预量化模型。
也可使用https://hub.docker.com/r/amperecomputingai/llama.cpp%E8%87%AA%E8%A1%8C%E9%87%8F%E5%8C%96%E6%A8%A1%E5%9E%8B%EF%BC%8C%E5%85%B7%E4%BD%93%E6%AD%A5%E9%AA%A4%E5%8F%82%E8%80%83https://github.com/AmpereComputingAI/llama.cpp/blob/main/README.md#quantization%E3%80%82
量化完成后,通过创建Modelfile在Ollama中使用:
FROM ./path/to/your/model.gguf
执行以下命令创建并运行模型:
consoleollama create my_model -f Modelfile ollama run my_model
如有问题,请联系:<***>
通过访问、下载或使用本软件及任何所需的依赖软件("Ampere AI软件"),您同意Ampere AI软件许可协议的条款和条件,其中可能包括Ampere AI软件中包含的第三方软件的通知、免责声明或许可条款。详情请参阅Ampere AI软件EULA v1.6或其他类似名称的文本文件。
以下是 amperecomputingai/ollama 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。





探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务