
作为Intel® AI for Enterprise RAG (ERAG)生态系统的关键组件,该镜像提供重排序模型服务,为OPEA ERAG重排序服务提供核心支持,能够高效评估文档与用户查询的相关性。其底层基于TorchServe构建,TorchServe是一个轻量级、可扩展且易于使用的PyTorch模型服务库,提供RESTful API接口,支持在生产环境中部署和服务训练好的模型。此外,TorchServe还集成了Intel® Extension for PyTorch*,可在Intel硬件上显著提升性能。
使用以下命令启动重排序模型服务器:
bashdocker run -d -p 8080:8080 -p 8081:8081 intel/opea-erag-torchserve-reranking:latest
-p 8080:8080:映射TorchServe推理API端口(用于接收预测请求)-p 8081:8081:映射TorchServe管理API端口(用于模型管理操作)可通过环境变量自定义服务参数:
| 环境变量 | 描述 | 默认值 |
|---|---|---|
MODEL_NAME | 重排序模型名称 | reranking_model |
MODEL_PATH | 模型文件在容器内的路径 | 预配置的默认模型路径 |
TS_CONFIG_FILE | TorchServe配置文件路径 | /home/model-server/config.properties |
INTEL_OPTIMIZATION | 是否启用Intel优化 | true |
BATCH_SIZE | 推理批处理大小 | 16 |
WORKERS | 模型工作进程数 | 自动根据CPU核心数配置 |
获取已部署模型信息:
bashcurl http://localhost:8081/models
查看模型详细状态:
bashcurl http://localhost:8081/models/reranking_model
提交重排序请求(评估文档与查询的相关性):
bashcurl -X POST http://localhost:8080/predictions/reranking_model \ -H "Content-Type: application/json" \ -d '{ "query": "什么是Intel® Extension for PyTorch*?", "documents": [ "Intel® Extension for PyTorch*是一个开源项目,旨在优化PyTorch在Intel硬件上的性能。", "PyTorch是一个开源的机器学习框架,广泛用于深度学习研究和开发。", "Intel® AI工具包提供了多种优化工具,帮助开发者提升AI应用性能。" ] }'
返回结果示例(包含相关性分数,降序排列):
json{ "ranked_documents": [ { "document": "Intel® Extension for PyTorch*是一个开源项目,旨在优化PyTorch在Intel硬件上的性能。", "score": 0.92 }, { "document": "Intel® AI工具包提供了多种优化工具,帮助开发者提升AI应用性能。", "score": 0.65 }, { "document": "PyTorch是一个开源的机器学习框架,广泛用于深度学习研究和开发。", "score": 0.41 } ] }
OPEA ERAG采用Apache License 2.0许可。
版权所有 © 2024–2026 Intel Corporation。保留所有权利。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。






探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务