
viktoruj/runnerSRE Platform Runner 是一款面向站点可靠性工程(SRE)领域的任务执行镜像,作为 SRE 平台的核心运行组件,负责接收并执行平台下发的各类自动化任务。其主要用途是作为 SRE 团队与底层运维系统的桥梁,提供标准化的任务运行环境,确保运维操作的一致性、可追溯性和可靠性。
通过以下命令快速启动 Runner 并连接至 SRE 平台:
bashdocker run -d \ --name sre-runner \ -e SRE_PLATFORM_API_URL="[***]" \ -e AUTH_TOKEN="your-platform-auth-token" \ -e LOG_LEVEL="info" \ -v /host/task-configs:/etc/sre-runner/tasks \ -v /var/run/docker.sock:/var/run/docker.sock \ # 如需操作宿主机容器 sre-platform/runner:latest
适用于与 SRE 平台其他组件(如 API 服务、数据库)协同部署的场景:
yamlversion: '3.8' services: sre-runner: image: sre-platform/runner:latest container_name: sre-runner restart: always environment: - SRE_PLATFORM_API_URL=[***] - AUTH_TOKEN=${SRE_PLATFORM_AUTH_TOKEN} - LOG_LEVEL=info - TASK_TIMEOUT=300 # 任务超时时间(秒) - MAX_CONCURRENT_TASKS=5 # 最大并发任务数 volumes: - ./task-configs:/etc/sre-runner/tasks:ro # 只读挂载任务配置目录 - ./logs:/var/log/sre-runner # 日志持久化 network_mode: "host" # 如需直接访问宿主机网络 resources: limits: cpus: '2' memory: 1G
| 环境变量名 | 描述 | 默认值 | 必须 |
|---|---|---|---|
| SRE_PLATFORM_API_URL | SRE 平台 API 地址,用于任务拉取与状态上报 | 无 | 是 |
| AUTH_TOKEN | 访问 SRE 平台的认证令牌 | 无 | 是 |
| LOG_LEVEL | 日志级别(debug/info/warn/error) | info | 否 |
| TASK_CONFIG_PATH | 本地任务配置文件目录(挂载宿主机目录) | /etc/sre-runner/tasks | 否 |
| TASK_TIMEOUT | 单任务超时时间(秒) | 300 | 否 |
| MAX_CONCURRENT_TASKS | 最大并发任务数 | 3 | 否 |
| METRICS_ENABLED | 是否开启 metrics 暴露(Prometheus) | false | 否 |
| METRICS_PORT | Metrics 暴露端口 | 9090 | 否 |
Runner 支持通过命令行参数覆盖部分配置(优先级:命令行参数 > 环境变量 > 默认值):
| 参数名 | 描述 | 示例 |
|---|---|---|
| --task-id | 指定单任务 ID 执行(调试用) | --task-id=*** |
| --log-level | 覆盖日志级别 | --log-level=debug |
| --no-sandbox | 禁用任务沙箱(不建议生产环境) | --no-sandbox |
AUTH_TOKEN 定期轮换确保安全

manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务