
本 Docker 镜像封装了 Kubernetes Job 通知插件,是一个轻量级工具,用于监控 Kubernetes 集群中 Job 资源的生命周期事件(如创建、完成、失败、超时等),并将事件信息通过指定渠道发送通知。
| 功能特性 | 说明 |
|---|---|
| 多渠道通知支持 | 支持邮件、Slack、Webhook、钉钉等主流通知渠道,可同时配置多个渠道 |
| 灵活的触发条件配置 | 可自定义通知触发条件(如仅失败时通知、成功/失败均通知、超时通知等) |
| Kubernetes API 原生集成 | 通过 Kubernetes API Server 监听 Job 资源事件,无需额外数据存储依赖 |
| 轻量化设计 | 基于 Alpine 基础镜像,镜像体积 < 50MB,资源占用低(CPU < 50m,内存 < 128Mi) |
| 配置动态更新 | 支持通过 ConfigMap 或环境变量动态调整通知配置,无需重启插件实例 |
| 事件详情自定义 | 可自定义通知内容模板(如包含 Job 名称、命名空间、持续时间、日志链接等) |
https://kubernetes.default.svc:443 访问)及通知渠道服务(如 Slack API、SMTP 服务器等)jobs 资源的 watch、list、get 操作bashdocker pull [镜像仓库地址]/k8s-job-notifier:v1.0.0 # 替换为实际镜像仓库地址和版本
插件支持两种配置方式:环境变量配置(适合简单场景)和 ConfigMap 配置(适合复杂场景,支持动态更新)。
4.2.1 环境变量配置
通过 docker run 或 Kubernetes Pod 的 env 字段传入环境变量,核心配置项如下(完整列表见 5.1 节):
| 环境变量名 | 说明 | 示例值 |
|---|---|---|
NOTIFICATION_CHANNELS | 启用的通知渠道(逗号分隔) | slack,webhook |
TRIGGER_CONDITIONS | 触发通知的 Job 状态(逗号分隔) | failed,timeout,completed |
SLACK_WEBHOOK_URL | Slack 通知 Webhook URL | https://hooks.slack.com/services/XXX |
WEBHOOK_ENDPOINT | Webhook 通知接收地址 | https://api.example.com/notify |
4.2.2 ConfigMap 配置
通过 ConfigMap 存储复杂配置(如多渠道详细参数、通知模板),示例 ConfigMap:
yamlapiVersion: v1 kind: ConfigMap metadata: name: job-notifier-config namespace: kube-system data: config.yaml: | notification: channels: - type: slack webhook_url: "https://hooks.slack.com/services/XXX" channel: "#job-alerts" username: "k8s-job-notifier" - type: webhook endpoint: "https://api.example.com/notify" method: "POST" headers: Content-Type: "application/json" trigger_conditions: ["failed", "timeout"] # 仅失败或超时触发通知 template: title: "Kubernetes Job {{.JobName}} ({{.Namespace}}) {{.Status}}" body: | Job 名称: {{.JobName}} 命名空间: {{.Namespace}} 状态: {{.Status}} 开始时间: {{.StartTime}} 持续时间: {{.Duration}} 日志链接: {{.LogURL}}
4.3.1 Docker 运行示例(单机测试用)
bashdocker run -d \ --name k8s-job-notifier \ -e KUBERNETES_API_URL="https://192.168.1.100:6443" # 替换为实际 K8s API 地址 -e KUBERNETES_TOKEN="eyJhbGciOiJSUzI1NiIsImtpZCI..." # 替换为具有 Job 访问权限的 Token -e NOTIFICATION_CHANNELS="slack" \ -e TRIGGER_CONDITIONS="failed,completed" \ -e SLACK_WEBHOOK_URL="https://hooks.slack.com/services/XXX" \ [镜像仓库地址]/k8s-job-notifier:v1.0.0
4.3.2 Kubernetes Deployment 部署示例(生产环境推荐)
步骤 1:创建 RBAC 权限配置
插件需通过 RBAC 获取监听 Job 资源的权限:
yamlapiVersion: v1 kind: ServiceAccount metadata: name: job-notifier-sa namespace: kube-system --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRole metadata: name: job-notifier-role rules: - apiGroups: ["batch"] resources: ["jobs"] verbs: ["watch", "list", "get"] # 监听 Job 事件需 watch/list/get 权限 --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRoleBinding metadata: name: job-notifier-binding subjects: - kind: ServiceAccount name: job-notifier-sa namespace: kube-system roleRef: kind: ClusterRole name: job-notifier-role apiGroup: rbac.authorization.k8s.io
步骤 2:创建 Deployment
使用 ConfigMap 配置(需先创建 4.2.2 节的 ConfigMap):
yamlapiVersion: apps/v1 kind: Deployment metadata: name: job-notifier namespace: kube-system spec: replicas: 1 selector: matchLabels: app: job-notifier template: metadata: labels: app: job-notifier spec: serviceAccountName: job-notifier-sa # 关联 RBAC 权限 containers: - name: job-notifier image: [镜像仓库地址]/k8s-job-notifier:v1.0.0 volumeMounts: - name: config-volume mountPath: /etc/job-notifier/config.yaml subPath: config.yaml # 挂载 ConfigMap 中的配置文件 resources: limits: cpu: 100m memory: 256Mi requests: cpu: 50m memory: 128Mi volumes: - name: config-volume configMap: name: job-notifier-config # 关联 4.2.2 节创建的 ConfigMap
检查 Pod 状态:
bashkubectl get pods -n kube-system -l app=job-notifier
确保 Pod 状态为 Running。
查看日志:
bashkubectl logs -n kube-system <pod-name> -f
确认日志中无错误信息,且包含 "Successfully connected to Kubernetes API" 等初始化成功日志。
测试通知:
创建一个测试 Job 并故意使其失败(如执行 exit 1),检查通知渠道是否收到告警。
| 参数名 | 必选 | 说明 | 默认值 | 示例值 |
|---|---|---|---|---|
KUBERNETES_API_URL | 否 | Kubernetes API Server 地址(集群内可省略,默认通过 Service 发现) | https://kubernetes.default.svc:443 | https://192.168.1.100:6443 |
NOTIFICATION_CHANNELS | 是 | 启用的通知渠道(逗号分隔,支持 slack/webhook/email/dingtalk) | - | slack,webhook |
TRIGGER_CONDITIONS | 否 | 触发通知的 Job 状态(逗号分隔,支持 completed/failed/timeout) | failed,timeout | completed,failed |
LOG_LEVEL | 否 | 日志级别(debug/info/warn/error) | info | debug |
SYNC_INTERVAL | 否 | Job 状态同步间隔(秒),用于补充事件监听遗漏的状态变更 | 30 | 60 |
5.2.1 Slack 渠道
| 参数名 | 必选 | 说明 | 示例值 |
|---|---|---|---|
SLACK_WEBHOOK_URL | 是 | Slack Incoming Webhook URL | https://hooks.slack.com/services/XXX |
SLACK_CHANNEL | 否 | 通知目标频道(默认使用 Webhook 配置的频道) | #dev-alerts |
SLACK_USERNAME | 否 | 通知发送者名称 | k8s-job-notifier |
5.2.2 Webhook 渠道
| 参数名 | 必选 | 说明 | 示例值 |
|---|---|---|---|
WEBHOOK_ENDPOINT | 是 | Webhook 接收地址 | https://api.example.com/notify |
WEBHOOK_METHOD | 否 | HTTP 请求方法(POST/GET) | POST |
WEBHOOK_TIMEOUT | 否 | 请求超时时间(秒) | 10 |
ClusterRole 权限以监听 Job 资源,参考 4.3.2 节的 RBAC 配置。batch/v1 Job 资源版本差异)。replicas: 2),避免单点故障。envFrom 挂载 Secret)。您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务