本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

镜像名称:k8s.gcr.io/kube-state-metrics/kube-state-metrics
官方维护:Kubernetes SIG Monitoring
功能定位:Kubernetes 集群状态指标收集工具,用于从 Kubernetes API 服务器抓取集群内资源对象(如 Pod、Deployment、Service 等)的状态指标,并通过 HTTP 接口暴露给监控系统(如 Prometheus)。
kube_pod_status_ready{condition="true"}),支持直接被 Prometheus 抓取。kube-state-metrics 需运行在 Kubernetes 集群内,主流部署方式包括 直接 YAML 部署 和 Helm 部署。
kube-state-metrics 主要通过命令行参数配置,支持自定义资源范围、指标过滤、网络端口等。
| 参数名 | 说明 | 默认值 |
|---|---|---|
--port | 指标暴露端口(Prometheus 抓取端口) | 8080 |
--telemetry-port | 自身监控端口(暴露组件内部指标,如 kube_state_metrics_build_info) | 8081 |
--namespace | 限制仅收集指定命名空间的资源(多命名空间用逗号分隔,默认全命名空间) | 空(全命名空间) |
--resources | 指定需收集的资源类型(多资源用逗号分隔,默认全资源) | 空(全资源) |
--metric-allowlist | 指标白名单(仅暴露符合正则的指标,如 kube_pod_.*) | 空(暴露所有指标) |
--metric-denylist | 指标黑名单(排除符合正则的指标,优先级高于白名单) | 空(不排除指标) |
--kubeconfig | 本地 kubeconfig 文件路径(集群外运行时使用,集群内无需指定) | 空(使用集群内 ServiceAccount) |
--leader-election | 启用 leader 选举(多副本部署时避免指标重复) | true |
kube-state-metrics 需通过 Kubernetes API 访问资源,需配置以下 RBAC 资源:
get/list/watch Pod、Node 等)。以下为完整部署示例,包含 Deployment、Service、RBAC 配置。
rbac.yaml)apiVersion: v1 kind: ServiceAccount metadata: name: kube-state-metrics namespace: kube-system --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRole metadata: name: kube-state-metrics rules: - apiGroups: [""] resources: ["pods", "nodes", "services", "endpoints", "namespaces", "configmaps", "secrets"] verbs: ["get", "list", "watch"] - apiGroups: ["apps"] resources: ["deployments", "daemonsets", "statefulsets", "replicasets"] verbs: ["get", "list", "watch"] - apiGroups: ["batch"] resources: ["jobs", "cronjobs"] verbs: ["get", "list", "watch"] --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRoleBinding metadata: name: kube-state-metrics subjects: - kind: ServiceAccount name: kube-state-metrics namespace: kube-system roleRef: kind: ClusterRole name: kube-state-metrics apiGroup: rbac.authorization.k8s.io
deployment.yaml)apiVersion: apps/v1 kind: Deployment metadata: name: kube-state-metrics namespace: kube-system labels: app: kube-state-metrics spec: replicas: 2 # 多副本提高可用性 selector: matchLabels: app: kube-state-metrics template: metadata: labels: app: kube-state-metrics spec: serviceAccountName: kube-state-metrics # 关联 RBAC 账号 containers: - name: kube-state-metrics image: k8s.gcr.io/kube-state-metrics/kube-state-metrics:v2.10.0 # 使用最新稳定版 ports: - containerPort: 8080 # 指标端口 name: metrics - containerPort: 8081 # 自身监控端口 name: telemetry args: - --resources=pods,deployments,nodes,services # 仅收集指定资源 - --metric-allowlist=kube_pod_.*,kube_deployment_.* # 仅暴露 Pod 和 Deployment 指标 resources: limits: cpu: 200m memory: 256Mi requests: cpu: 100m memory: 128Mi livenessProbe: httpGet: path: /healthz port: 8080 initialDelaySeconds: 5 periodSeconds: 10 readinessProbe: httpGet: path: / port: 8080 initialDelaySeconds: 5 periodSeconds: 10
service.yaml)apiVersion: v1 kind: Service metadata: name: kube-state-metrics namespace: kube-system labels: app: kube-state-metrics spec: ports: - name: metrics port: 8080 targetPort: metrics - name: telemetry port: 8081 targetPort: telemetry selector: app: kube-state-metrics
通过 Helm 部署可简化配置管理,支持自定义参数:
# 添加 Helm 仓库 helm repo add prometheus-community [***] helm repo update # 安装 kube-state-metrics(自定义资源和指标过滤) helm install kube-state-metrics prometheus-community/kube-state-metrics \ --namespace kube-system \ --set resourcesToWatch="{pods,deployments,nodes}" \ --set metricAllowlist="{kube_pod_.*,kube_deployment_.*}" \ --set replicaCount=2
注意:kube-state-metrics 通常需运行在 Kubernetes 集群内,本地 Docker 运行需通过 kubeconfig 访问集群 API:
docker run -d \ --name kube-state-metrics \ -p 8080:8080 \ -v ~/.kube/config:/kubeconfig \ # 挂载本地 kubeconfig k8s.gcr.io/kube-state-metrics/kube-state-metrics:v2.10.0 \ --kubeconfig=/kubeconfig \ --resources=pods,deployments
在 Prometheus 的 prometheus.yml 中添加抓取规则:
scrape_configs: - job_name: 'kube-state-metrics' static_configs: - targets: ['kube-state-metrics.kube-system.svc:8080'] # 通过 Service 域名访问
现象:Pod 日志报 forbidden: User "system:serviceaccount:kube-system:kube-state-metrics" cannot list resource。
解决:检查 RBAC 配置,确保 ClusterRole 包含需访问的资源权限(参考 5.1.1 节)。
--leader-election,导致同一指标被多次暴露。需确保 --leader-election=true(默认启用)。--resources 或 --metric-allowlist 参数是否误过滤了目标资源/指标。kube-state-metrics 版本需与 Kubernetes 集群版本匹配,例如:
--resources),仅收集核心资源;--metric-allowlist 过滤非必要指标。免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429