本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

本Docker镜像整合了TensorFlow Serving与FastAPI框架,提供一站式机器学***模型部署解决方案。TensorFlow Serving负责高效加载和运行TensorFlow训练模型,提供底层推理能力;FastAPI则构建高性能RESTful API接口,实现模型服务的便捷调用。两者结合消除了模型部署中的服务配置复杂性,帮助开发者快速将训练好的TensorFlow模型转化为生产级API服务。
saved_model.pb及variables/目录)| 环境变量名 | 描述 | 默认值 |
|---|---|---|
MODEL_NAME | 模型名称(用于API路径标识) | "model" |
MODEL_PATH | 容器内模型存储路径 | "/models" |
API_PORT | FastAPI服务监听端口 | 8000 |
SERVING_PORT | TensorFlow Serving内部端口 | 8500 |
BATCH_SIZE | 推理请求批处理大小(可选) | 1 |
docker run -d \ --name tf-serving-api \ -p 8000:8000 \ -v /local/model/path:/models/model \ # 挂载本地SavedModel目录 -e MODEL_NAME="image_classifier" \ # 设置模型名称 -e API_PORT=8000 \ # 设置API服务端口 tensorflow-serving-fastapi:latest
注意:本地模型目录
/local/model/path需包含完整SavedModel结构,例如:/local/model/path/ ├── saved_model.pb └── variables/ ├── variables.data-00000-of-00001 └── variables.index
创建docker-compose.yml:
version: '3.8' services: model-service: image: tensorflow-serving-fastapi:latest container_name: tf-model-service ports: - "8000:8000" volumes: - ./models/classifier:/models/model # 本地模型目录相对路径 environment: - MODEL_NAME=classifier - MODEL_PATH=/models/model - API_PORT=8000 restart: unless-stopped
启动服务:
docker-compose up -d
服务启动后,可通过以下方式访问:
http://localhost:8000/docshttp://localhost:8000/redoc假设模型接收形状为[1, 224, 224, 3]的图像数据:
curl -X POST "http://localhost:8000/predict" \ -H "Content-Type: application/json" \ -d '{ "inputs": [[[[0.1, 0.2, 0.3], [0.4, 0.5, 0.6], ...]]] # 224x224x3图像数据 }'
响应示例:
{ "predictions": [0.92, 0.05, 0.03], # 模型推理结果(示例) "model_name": "image_classifier", "timestamp": "2023-11-01T12:34:56Z" }
通过修改启动脚本支持多模型部署(需自定义配置):
/models/model1、/models/model2)MODEL_NAME为模型列表(如"model1,model2")/predict/model1、/predict/model2BATCH_SIZE参数,或通过docker run --cpus限制CPU资源。docker logs tf-serving-api查看服务运行日志,排查模型加载或请求错误。免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429