
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Docker GenAI Stack 容器镜像是专为Docker GenAI技术栈设计的容器化解决方案,旨在简化生成式人工智能(GenAI)应用的部署、运行与管理流程。该镜像提供预配置的运行环境,集成核心依赖组件与工具链,减少开发与运维复杂度,帮助用户快速构建稳定、可扩展的GenAI应用容器化架构。
为GenAI应用开发者提供一致的本地开发环境,避免"环境不一致"问题,加速开发迭代
在测试环境中快速部署不同版本的GenAI模型,进行功能验证、性能测试及兼容性测试
作为生产级GenAI服务的容器化载体,支持高可用部署、弹性伸缩及服务网格集成
用于GenAI技术教学或产品演示,通过容器快速搭建可复现的演示环境
通过以下命令快速启动容器实例:
bashdocker run -d \ --name genai-service \ -p 8080:8080 \ -e GENAI_MODEL_PATH=/app/models \ -e LOG_LEVEL=info \ -v /host/path/to/models:/app/models \ docker-genai-stack:latest
创建docker-compose.yml文件,定义服务配置:
yamlversion: '3.8' services: genai-app: image: docker-genai-stack:latest container_name: genai-app restart: always ports: - "8080:8080" # API服务端口 - "6006:6006" # TensorBoard监控端口(若启用) environment: - GENAI_MODEL_PATH=/app/models # 模型文件路径 - GPU_SUPPORT=true # 启用GPU支持(需主机配置nvidia-docker) - MAX_CONCURRENT_REQUESTS=10 # 最大并发请求数 - LOG_LEVEL=info # 日志级别:debug/info/warn/error volumes: - ./local-models:/app/models # 挂载本地模型目录 - ./logs:/app/logs # 挂载日志目录 deploy: resources: reservations: devices: - driver: nvidia count: 1 # 使用1块GPU capabilities: [gpu] # GPU能力声明
启动服务:
bashdocker-compose up -d
| 环境变量名 | 描述 | 默认值 | 可选值 |
|---|---|---|---|
GENAI_MODEL_PATH | 模型文件存储路径 | /app/models | 容器内绝对路径 |
GPU_SUPPORT | 是否启用GPU加速 | false | true/false |
LOG_LEVEL | 日志输出级别 | info | debug/info/warn/error |
MAX_CONCURRENT_REQUESTS | 最大并发请求数 | 5 | 正整数 |
API_TIMEOUT | API请求超时时间(秒) | 30 | 正整数 |
MODEL_CACHE_SIZE | 模型缓存大小(GB) | 2 | 正整数(根据可用内存配置) |
GPU支持要求
启用GPU加速时,主机需安装NVIDIA驱动及nvidia-docker运行时,详情参考https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html
模型文件管理
建议通过卷挂载(-v参数)方式加载模型文件,避免镜像体积过大;大型模型(>10GB)建议使用模型分片或分布式加载
性能优化建议
--cpus、--memory参数)安全考量
--privileged权限运行容器.env)管理,避免明文暴露您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务