
kserve/rest-proxyKServe REST Proxy是一个轻量级代理服务,旨在实现REST API与gRPC之间的协议转换。该镜像特别为KServe模型服务设计,允许客户端使用熟悉的REST API与基于gRPC的后端服务进行通信,简化了不同协议之间的集成过程。
使用以下命令启动REST Proxy容器:
bashdocker run -p 8080:8080 kserve/rest-proxy:latest
| 环境变量 | 描述 | 默认值 |
|---|---|---|
GRPC_BACKEND | gRPC后端服务地址 | localhost:8081 |
REST_PORT | REST API监听端口 | 8080 |
LOG_LEVEL | 日志级别 | info |
MAX_RETRY | 后端连接重试次数 | 3 |
RETRY_DELAY | 重试延迟时间(毫秒) | 1000 |
可以通过挂载配置文件来自定义路由规则:
bashdocker run -p 8080:8080 -v ./routes.yaml:/etc/rest-proxy/routes.yaml kserve/rest-proxy:latest
yamlversion: '3' services: rest-proxy: image: kserve/rest-proxy:latest ports: - "8080:8080" environment: - GRPC_BACKEND=model-server:8081 - LOG_LEVEL=debug depends_on: - model-server model-server: image: kserve/model-server:latest ports: - "8081:8081"
POST /v1/models/{model_name}:predict
请求体示例:
json{ "instances": [ {"data": [1.0, 2.0, 3.0]} ] }
GET /v1/models/{model_name}
GET /health


manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务