
openiamdocker/kube-state-metricskube-state-metrics是一个开源工具,作为Docker镜像提供,用于从Kubernetes API服务器采集各类资源对象(Pod、Deployment、StatefulSet、Service、Node、ConfigMap等)的状态指标,并将这些指标以Prometheus可抓取的格式暴露在HTTP端点上。该镜像旨在帮助用户实时监控Kubernetes集群的资源状态、运行健康度和配置信息,为Prometheus等监控系统提供数据源,支持集群状态分析、告警配置和性能优化。
kube_deployment_status_replicas_unavailable)配置告警,及时发现集群异常。kube_pod_container_resource_requests_cpu_cores)分析资源分配与实际使用的匹配度。get、list、watch资源权限)。kube-state-metrics通常在Kubernetes集群内通过Deployment部署,以下是基础部署清单示例:
yaml# kube-state-metrics-deployment.yaml apiVersion: apps/v1 kind: Deployment metadata: name: kube-state-metrics namespace: monitoring spec: replicas: 1 selector: matchLabels: app: kube-state-metrics template: metadata: labels: app: kube-state-metrics spec: serviceAccountName: kube-state-metrics # 需提前创建带RBAC权限的ServiceAccount containers: - name: kube-state-metrics image: bitnami/kube-state-metrics:latest # 或其他官方维护的镜像(如prometheuscommunity/kube-state-metrics) ports: - containerPort: 8080 # 指标暴露端口 - containerPort: 8081 # 自身监控指标端口 args: - --port=8080 # 指标端口 - --telemetry-port=8081 # 自身监控端口 - --namespace=default # 可选,限制监控单个命名空间(默认监控所有) - --metric-allowlist=kube_pod_.* # 可选,只暴露Pod相关指标
配套RBAC配置示例:
yaml# kube-state-metrics-rbac.yaml apiVersion: v1 kind: ServiceAccount metadata: name: kube-state-metrics namespace: monitoring --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRole metadata: name: kube-state-metrics rules: - apiGroups: [""] resources: ["pods", "nodes", "services", "endpoints", "configmaps", "secrets"] verbs: ["list", "watch"] - apiGroups: ["apps"] resources: ["deployments", "statefulsets", "daemonsets", "replicasets"] verbs: ["list", "watch"] - apiGroups: ["batch"] resources: ["jobs", "cronjobs"] verbs: ["list", "watch"] --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRoleBinding metadata: name: kube-state-metrics subjects: - kind: ServiceAccount name: kube-state-metrics namespace: monitoring roleRef: kind: ClusterRole name: kube-state-metrics apiGroup: rbac.authorization.k8s.io
kube-state-metrics通过命令行参数配置,常用参数如下:
| 参数名 | 描述 | 默认值 |
|---|---|---|
--port | 暴露指标的HTTP端口 | 8080 |
--telemetry-port | 暴露自身监控指标的HTTP端口 | 8081 |
--kubeconfig | 集群外运行时,指定kubeconfig文件路径(集群内通过Service Account认证时无需配置) | 无 |
--namespace | 限制监控的命名空间,多个命名空间用逗号分隔(默认监控所有命名空间) | "" |
--metric-allowlist | 允许暴露的指标正则表达式(如kube_pod_.*),未匹配的指标将被过滤 | 暴露所有指标 |
--metric-denylist | 禁止暴露的指标正则表达式,优先级高于--metric-allowlist | 无 |
--resources | 要监控的资源类型,多个资源用逗号分隔(如pods,deployments) | 监控所有支持的资源 |
部署后,可通过容器的--port(默认8080)访问指标,例如:
http://<pod-ip>:8080/metricskube-state-metrics.monitoring.svc:8080)抓取指标。--metric-allowlist),减少指标数量,降低资源占用。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务