本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com
GitLab AI Gateway 自托管版是 GitLab 官方提供的容器化部署方案,用于在私有基础设施中部署 AI 请求管理网关。该网关作为 GitLab 实例与各类 AI 模型服务(如 OpenAI、Anthropic、Google Vertex AI 等)之间的中间层,提供请求路由、认证授权、流量控制、日志监控等核心能力,支持企业级 GitLab 环境的 AI 功能私有化部署与管控。
从 GitLab Container Registry 拉取官方镜像:
docker pull registry.gitlab.com/gitlab-org/ai-gateway:latest
docker run -d \ --name gitlab-ai-gateway \ -p 8080:8080 \ -e GITLAB_URL="[***]" \ -e GITLAB_API_TOKEN="glpat-xxxxxx" \ -e LOG_LEVEL="info" \ registry.gitlab.com/gitlab-org/ai-gateway:latest
docker run -d \ --name gitlab-ai-gateway \ -p 8080:8080 \ -e GITLAB_URL="[***]" \ -e GITLAB_API_TOKEN="glpat-xxxxxx" \ -v /path/to/local/config.yaml:/etc/ai-gateway/config.yaml \ registry.gitlab.com/gitlab-org/ai-gateway:latest
创建 docker-compose.yml:
version: '3.8' services: ai-gateway: image: registry.gitlab.com/gitlab-org/ai-gateway:latest container_name: gitlab-ai-gateway restart: unless-stopped ports: - "8080:8080" environment: - GITLAB_URL=[***] - GITLAB_API_TOKEN=glpat-xxxxxx - LOG_LEVEL=info - PORT=8080 - METRICS_ENABLED=true - METRICS_PORT=9090 volumes: - ./config.yaml:/etc/ai-gateway/config.yaml # 挂载自定义配置文件 - ./logs:/var/log/ai-gateway # 挂载日志目录 networks: - gitlab-network networks: gitlab-network: external: true # 假设已存在与 GitLab 实例互通的网络
| 环境变量名 | 必选 | 描述 | 示例值 |
|---|---|---|---|
GITLAB_URL | 是 | GitLab 实例基础 URL(自托管或 SaaS) | [***] |
GITLAB_API_TOKEN | 是 | GitLab 个人访问令牌(需具备 api 和 read_user 权限) | glpat-abc123def456 |
PORT | 否 | 服务监听端口(默认:8080) | 8080 |
LOG_LEVEL | 否 | 日志级别(debug/info/warn/error,默认:info) | info |
LOG_FORMAT | 否 | 日志格式(json/text,默认:text) | json |
METRICS_ENABLED | 否 | 是否启用 metrics 接口(默认:true) | true |
METRICS_PORT | 否 | metrics 接口端口(默认:9090) | 9090 |
CONFIG_FILE_PATH | 否 | 自定义配置文件路径(容器内路径,默认:/etc/ai-gateway/config.yaml) | /etc/ai-gateway/custom.yaml |
通过挂载配置文件可实现复杂路由规则和模型配置,示例:
# 模型服务配置 models: - name: "openai-gpt4" type: "openai" base_url: "[***]" api_key: "sk-xxxxxx" # 或通过环境变量 OPENAI_API_KEY 注入 timeout: 30s rate_limit: requests_per_minute: 1000 # 全局限流 - name: "anthropic-claude" type: "anthropic" base_url: "[***]" api_key: "sk-ant-xxxxxx" timeout: 60s # 路由规则(与 GitLab 项目/用户关联) routes: - match: gitlab_project_id: "123" # 仅允许项目 ID 123 访问 model_name: "openai-gpt4" destination: "openai-gpt4" rate_limit: requests_per_minute: 200 # 项目级限流 - match: gitlab_group_id: "456" # 允许组 ID 456 下所有项目访问 model_name: "anthropic-claude" destination: "anthropic-claude" # GitLab 集成配置 gitlab: timeout: 10s verify_tls: true # 禁用自签名证书时设为 false
在 docker run 或 docker-compose 中通过 -v 挂载本地配置文件:
-v /local/path/to/config.yaml:/etc/ai-gateway/config.yaml
启动服务:
docker start gitlab-ai-gateway
验证运行状态:
docker logs -f gitlab-ai-gateway # 查看启动日志,确认无报错 curl http://localhost:8080/health # 健康检查接口,返回 {"status":"ok"}
验证 GitLab 集成:
通过 GitLab 实例的 AI 功能(如代码建议)发起请求,在网关日志中查看请求记录。
升级镜像:
docker pull registry.gitlab.com/gitlab-org/ai-gateway:latest docker stop gitlab-ai-gateway && docker rm gitlab-ai-gateway # 重新执行 docker run 或 docker-compose up -d
数据备份:
定期备份配置文件(config.yaml)和日志目录(/var/log/ai-gateway)。
Q:如何排查请求失败?
A:查看容器日志(docker logs),开启 LOG_LEVEL=debug 获取详细请求信息,检查网络连通性和 API 密钥有效性。
Q:能否对接私有部署的 AI 模型(如本地 Llama)?
A:支持,在 models 配置中设置 type: "generic" 并指定 base_url 为私有模型服务地址。
Q:如何限制单个用户的 AI 请求配额?
A:在 routes 配置中通过 gitlab_user_id 匹配用户,并设置 rate_limit 即可。
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429