
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
本仓库包含实例化和部署图像标题生成模型的代码。该模型从固定词汇表生成描述COCO数据集中图像内容的标题。模型由_编码器_(基于Inception-v3架构的深度卷积网络,在ImageNet-2012数据上训练)和_解码器_(基于编码器输出进行训练的LSTM网络)组成。输入为图像,输出为描述图像内容的句子。
该模型基于https://github.com/tensorflow/models/tree/master/research/im2txt%E6%9E%84%E5%BB%BA%EF%BC%8C checkpoint文件托管在IBM Cloud Object Storage。本仓库代码将模型部署为Docker容器中的Web服务,是https://developer.ibm.com/code/exchanges/models/%E7%9A%84%E4%B8%80%E9%83%A8%E5%88%86%E3%80%82
| 领域 | 应用 | 行业 | 框架 | 训练数据 | 输入数据格式 |
|---|---|---|---|---|---|
| 计算机视觉 | 图像标题生成器 | 通用 | TensorFlow | COCO | 图像 |
| 组件 | 许可证 | 链接 |
|---|---|---|
| 本仓库 | https://www.apache.org/licenses/LICENSE-2.0 | LICENSE |
| 模型权重 | https://opensource.org/licenses/MIT | https://github.com/KranthiGV/Pretrained-Show-and-Tell-model |
| 模型代码(第三方) | https://www.apache.org/licenses/LICENSE-2.0 | https://github.com/tensorflow/models/tree/master/research/im2txt |
| 测试资源 | 多种 | 样本README |
docker:Docker命令行界面,需按照https://docs.docker.com/install/%E9%85%8D%E7%BD%AE%E7%B3%BB%E7%BB%9F%E3%80%82运行以下命令启动模型服务API:
bash$ docker run -it -p 5000:5000 quay.io/codait/max-image-caption-generator
该命令将从Quay.io容器 registry拉取预构建镜像(或使用本地缓存镜像)并运行。如需本地构建模型,可参考下方本地运行步骤。
按照https://developer.ibm.com/tutorials/deploy-a-model-asset-exchange-microservice-on-red-hat-openshift/%E4%B8%AD%E7%9A%84OpenShift Web控制台或OpenShift容器平台CLI说明,指定镜像名称为quay.io/codait/max-image-caption-generator即可部署模型服务微服务。
使用Quay上的最新Docker镜像在Kubernetes上部署模型:
bash$ kubectl apply -f https://raw.githubusercontent.com/IBM/MAX-Image-Caption-Generator/master/max-image-caption-generator.yaml
模型将在内部端口5000可用,也可通过NodePort从外部访问。有关在https://ibm.biz/Bdz2XM%E4%B8%8A%E9%83%A8%E7%BD%B2MAX%E6%A8%A1%E5%9E%8B%E7%9A%84%E8%AF%A6%E7%BB%86%E6%95%99%E7%A8%8B%EF%BC%8C%E8%AF%B7%E5%8F%82%E8%A7%81http://ibm.biz/max-to-ibm-cloud-tutorial%E3%80%82
克隆本仓库并进入目录:
bash$ git clone https://github.com/IBM/MAX-Image-Caption-Generator.git $ cd MAX-Image-Caption-Generator
本地构建Docker镜像:
bash$ docker build -t max-image-caption-generator .
构建过程中将自动下载所有必要的模型资产。注意:当前此Docker镜像仅支持CPU(后续将添加GPU支持)。
运行Docker镜像以启动模型服务API:
bash$ docker run -it -p 5000:5000 max-image-caption-generator
API服务器自动生成交互式Swagger文档页面,访问http://localhost:5000即可加载。通过该页面可浏览API并创建测试请求。
使用model/predict端点上传测试文件并获取图像标题:
!Swagger截图
也可通过命令行测试,例如:
bash$ curl -F "image=@samples/surfing.jpg" -X POST http://localhost:5000/model/predict
响应示例:
json{ "status": "ok", "predictions": [ { "index": "0", "caption": "a man riding a wave on top of a surfboard .", "probability": 0.038827644239537 }, { "index": "1", "caption": "a person riding a surf board on a wave", "probability": 0.017933410519265 }, { "index": "2", "caption": "a man riding a wave on a surfboard in the ocean .", "probability": 0.0056628732021868 } ] }
如需以调试模式运行Flask API应用,编辑config.py将应用设置下的DEBUG = True,然后重新构建Docker镜像(参见步骤1)。
在终端中按CTRL + C停止Docker容器。
如对模型资产交换项目有贡献意向或疑问,请遵循https://github.com/CODAIT/max-central-repo%E7%9A%84%E8%AF%B4%E6%98%8E%E3%80%82
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务