
beloved70020/bge-reranker-v2-m3)该Docker镜像提供一个即用型、高性能的API服务,用于使用BAAI/bge-reranker-v2-m3模型进行文档重排序。它基于FastAPI和Uvicorn构建,可开箱即用。容器内的服务监听8080端口。
BAAI/bge-reranker-v2-m3模型,确保高质量文档重排序。8080端口即可。/v1/rerank端点,用于提交查询和文档列表。FlagEmbedding库进行高效推理。在支持CUDA的GPU环境中(若容器可访问主机GPU),支持FP16精度以实现更快处理。/health端点,用于监控服务状态和已加载的BAAI/bge-reranker-v2-m3模型。该镜像专门构建和配置用于:
BAAI/bge-reranker-v2-m3模型在镜像构建过程中已下载并缓存于镜像内。
容器内的服务监听8080端口。需将主机端口映射到容器的8080端口。
若要运行服务,将主机端口8080映射到容器的8080端口:
bashdocker run -d -p 8080:8080 -v /dev/shm:/dev/shm beloved70020/bge-reranker-v2-m3:latest
若需使用不同的主机端口(例如8101):
bashdocker run -d -p 8101:8080 -v /dev/shm:/dev/shm beloved70020/bge-reranker-v2-m3:latest
/v1/rerank若请求中包含model字段,其值必须为BAAI/bge-reranker-v2-m3。
请求:
POST /v1/rerankContent-Type: application/jsonjson{ "model": "BAAI/bge-reranker-v2-m3", // 必须为此服务指定的模型 "query": "法国的首都是什么?", "documents": [ "巴黎是法国的首都。", "伦敦是英国的一个大城市。", "埃菲尔铁塔是巴黎著名的地标。" ], "top_n": 2 // 可选:返回的top结果数量 }
使用cURL示例(假设服务映射到主机端口8080):
bashcurl -X POST http://localhost:8080/v1/rerank \ -H "Content-Type: application/json" \ -d '{ "query": "法国的首都是什么?", "documents": [ "巴黎是法国的首都。", "伦敦是英国的一个大城市。", "埃菲尔铁塔是巴黎著名的地标。" ], "top_n": 2, "model": "BAAI/bge-reranker-v2-m3" }'
响应:
json{ "results": [ { "index": 0, // 文档的原始索引 "relevance_score": 0.9876, // BAAI/bge-reranker-v2-m3返回的示例分数 "document": { "text": "巴黎是法国的首都。" } }, { "index": 2, "relevance_score": 0.9543, // 示例分数 "document": { "text": "埃菲尔铁塔是巴黎著名的地标。" } } ], "usage": { "prompt_tokens": 25, // 查询+文档的示例token数量 "completion_tokens": 0, "total_tokens": 25 } }
GET /health使用cURL示例(假设服务映射到主机端口8080):
bashcurl http://localhost:8080/health
响应:
json{ "status": "ok", "models_loaded": { "reranker": true }, "model_ids": { "reranker": "BAAI/bge-reranker-v2-m3" // 确认已加载的特定模型 } }
该镜像设计为开箱即用,标准操作无需用户设置任何环境变量。内部环境变量(如固定为8080的PORT、固定为BAAI/bge-reranker-v2-m3的RERANKER_MODEL_ID、HF_HOME、HOST等)已预配置以确保最佳功能,不建议用户修改。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。




探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务