ghcr.io/huggingface/text-embeddings-inference:1.7.4 Docker...

ghcr.io

ghcr.iolinux/amd641.7.4大小: 1.11GB更新于 2025年8月24日

Hugging Face的text-embeddings-inference是一款文本嵌入推理工具，通过容器化形式提供，核心功能是将文本转化为计算机可处理的向量表示。它支持多种主流开源文本嵌入模型，包括Sentence-BERT系列（如轻量级的all-MiniLM-L6-v2）、基础BERT模型等，适配不同文本长度和精度需求的场景。使用时，用户输入原始文本后，工具会自动完成预处理（如分词、长度截断）、模型推理和向量生成，输出维度统一的稠密向量，可直接用于下游任务。作为容器镜像，它部署灵活，能在本地服务器、云平台或Kubernetes集群中快速启动，省去复杂的环境配置步骤。同时针对推理性能做了优化：支持动态批处理（根据输入文本量自动调整批大小）和模型缓存，在保证向量精度的前提下降低延迟——普通GPU上单条短句推理延迟可控制在毫秒级，批量处理时吞吐量进一步提升，适合高并发场景。实际应用中，它可用于多个领域：搜索引擎的语义检索（通过向量匹配相似内容）、推荐系统（用户行为文本与物品描述向量比对提升相关性）、文本聚类（通过向量距离快速归并相似文本）、文本分类（用向量作为特征输入分类模型）等。对于需要高效文本向量化的开发者或企业，它提供了开箱即用的解决方案，平衡了易用性、性能和兼容性。

ghcr.io/huggingface/text-embeddings-inference:1.7.4

拉取命令

专属域名未获取到

更多版本

轩辕镜像配置手册

Docker 配置

登录仓库拉取

专属域名拉取

K8s Containerd

K3s

Dev Containers

Podman

Singularity/Apptainer

其他仓库配置

Harbor 镜像源配置

Portainer 镜像源配置

Nexus 镜像源配置

系统配置

Linux

Windows/Mac

MacOS OrbStack

Docker Compose

NAS 设备

群晖

飞牛

绿联

威联通

极空间

网络设备

爱快路由

宝塔面板

镜像拉取常见问题

使用与功能问题

配置了专属域名后，docker search 为什么会报错？

Docker Hub 上有的镜像，为什么在轩辕镜像网站搜不到？

机器不能直连外网时，怎么用 docker save / load 迁镜像？

docker pull 拉插件报错（plugin v1+json）怎么办？

WSL 里 Docker 拉镜像特别慢，怎么排查和优化？

轩辕镜像安全吗？如何用 digest 校验镜像没被篡改？

第一次用轩辕镜像拉 Docker 镜像，要怎么登录和配置？

错误码与失败问题

docker pull 提示 manifest unknown 怎么办？

docker pull 提示 no matching manifest 怎么办？

镜像已拉取完成，却提示 invalid tar header 或 failed to register layer 怎么办？

Docker pull 时 HTTPS / TLS 证书验证失败怎么办？

Docker pull 时 DNS 解析超时或连不上仓库怎么办？

Docker 拉取出现 410 Gone 怎么办？

出现 402 或「流量用尽」提示怎么办？

Docker 拉取提示 UNAUTHORIZED（401）怎么办？

遇到 429 Too Many Requests（请求太频繁）怎么办？

docker login 提示 Cannot autolaunch D-Bus，还算登录成功吗？

为什么会出现「单层超过 20GB」或 413，无法加速拉取？

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别？

轩辕镜像支持哪些 Docker 镜像仓库？

镜像拉取失败还会不会扣流量？

麒麟 V10 / 统信 UOS 提示 KYSEC 权限不够怎么办？

如何在轩辕镜像申请开具发票？

怎么修改轩辕镜像的网站登录和仓库登录密码？

如何注销轩辕镜像账户？要注意什么？

配置与原理类

写了 registry-mirrors，为什么还是走官方或仍然报错？

怎么用 docker tag 去掉镜像名里的轩辕域名前缀？

如何拉取指定 CPU 架构的镜像（如 ARM64、AMD64）？

用轩辕镜像拉镜像时快时慢，常见原因有哪些？

用户好评