热门搜索:

ghcr.iolinux/amd64v0.4.27大小: 未知更新于 2026年5月23日

k8sgpt 是一款用于扫描 Kubernetes 集群、诊断问题并以简洁英文分类问题的工具。

其分析器中整合了 SRE 经验，有助于提取最相关的信息并通过 AI 进行丰富。

开箱即用地集成了 OpenAI、Azure、Cohere、Amazon Bedrock、Google Gemini 以及本地模型。

姊妹项目： 查看 https://github.com/AlexsJones/sympozium/ 以管理 Kubernetes 中的代理。

CLI 安装

Linux/Mac 通过 brew

brew install k8sgpt

或

brew tap k8sgpt-ai/k8sgpt
brew install k8sgpt

基于 RPM 的安装（RedHat/CentOS/Fedora）

32 位：

sudo rpm -ivh https://github.com/k8sgpt-ai/k8sgpt/releases/download/v0.4.33/k8sgpt_386.rpm

64 位：

sudo rpm -ivh https://github.com/k8sgpt-ai/k8sgpt/releases/download/v0.4.33/k8sgpt_amd64.rpm

基于 DEB 的安装（Ubuntu/Debian）

32 位：

curl -LO https://github.com/k8sgpt-ai/k8sgpt/releases/download/v0.4.33/k8sgpt_386.deb
sudo dpkg -i k8sgpt_386.deb

64 位：

curl -LO https://github.com/k8sgpt-ai/k8sgpt/releases/download/v0.4.33/k8sgpt_amd64.deb
sudo dpkg -i k8sgpt_amd64.deb

基于 APK 的安装（Alpine）

32 位：

wget https://github.com/k8sgpt-ai/k8sgpt/releases/download/v0.4.33/k8sgpt_386.apk
apk add --allow-untrusted k8sgpt_386.apk

64 位：

wget https://github.com/k8sgpt-ai/k8sgpt/releases/download/v0.4.33/k8sgpt_amd64.apk
apk add --allow-untrusted k8sgpt_amd64.apk

在 WSL 或 Linux 上安装失败（缺少 gcc）在 WSL 或 Linux 上安装 Homebrew 时，可能会遇到以下错误：

==> Installing k8sgpt from k8sgpt-ai/k8sgpt Error: The following formula cannot be installed from a bottle and must be
built from the source. k8sgpt Install Clang or run brew install gcc.

如果按提示安装 gcc，问题仍会存在。因此，需要安装 build-essential 包。

sudo apt-get update
sudo apt-get install build-essential

Windows

从 https://github.com/k8sgpt-ai/k8sgpt/releases 标签页下载最新的 k8sgpt Windows 二进制文件（根据系统架构选择）。
将下载的包解压到所需位置。将二进制文件位置配置到系统 PATH 环境变量中

Operator 安装

如需在 Kubernetes 集群内安装，请使用我们的 k8sgpt-operator，安装说明可在 https://github.com/k8sgpt-ai/k8sgpt-operator 获取。

此操作模式适用于对集群进行持续监控，并可与现有的监控系统（如 Prometheus 和 Alertmanager）集成。

快速开始

当前默认 AI 提供程序为 OpenAI，需从 OpenAI 生成 API 密钥。
可运行 k8sgpt generate 打开浏览器链接生成密钥。
运行 k8sgpt auth add 将密钥设置到 k8sgpt 中。
可使用 --password 标志直接提供密码。
运行 k8sgpt filters 管理分析器使用的活动过滤器。默认情况下，分析期间会执行所有过滤器。
运行 k8sgpt analyze 执行扫描。
使用 k8sgpt analyze --explain 获取问题的详细解释。
也可运行 k8sgpt analyze --with-doc（可与 --explain 标志一起使用）获取 Kubernetes 官方文档。

示例：

简单过滤器：k8sgpt filters remove Service
多个过滤器：k8sgpt filters remove Ingress,Pod

其他命令

列出已配置的后端

k8sgpt auth list

更新已配置的后端

k8sgpt auth update $MY_BACKEND1,$MY_BACKEND2..

移除已配置的后端

k8sgpt auth remove -b $MY_BACKEND1,$MY_BACKEND2..

列出集成

k8sgpt integrations list

激活集成

k8sgpt integrations activate [integration(s)]

使用集成

k8sgpt analyze --filter=[integration(s)]

停用集成

k8sgpt integrations deactivate [integration(s)]

服务模式

k8sgpt serve

带MCP（模型上下文协议）的服务模式

# 在默认端口8089上启用MCP服务器
k8sgpt serve --mcp --mcp-http

# 在自定义端口上启用MCP服务器
k8sgpt serve --mcp --mcp-http --mcp-port 8089

# 带MCP的完整服务模式
k8sgpt serve --mcp --mcp-http --port 8080 --metrics-port 8081 --mcp-port 8089

MCP服务器支持与Claude Desktop等MCP兼容客户端集成。它默认运行在8089端口，提供：

通过MCP协议进行Kubernetes集群分析
资源信息和健康状态
AI驱动的问题解释和建议

如需部署支持MCP的Helm chart，请参见charts/k8sgpt/values-mcp-example.yaml文件。

服务模式下的分析

grpcurl -plaintext -d '{"namespace": "k8sgpt", "explain" : "true"}' localhost:8080 schema.v1.ServerAnalyzerService/Analyze
{
"status": "OK"
}

带自定义头的分析

k8sgpt analyze --explain --custom-headers CustomHeaderKey:CustomHeaderValue

打印分析统计信息

k8sgpt analyze -s
The stats mode allows for debugging and understanding the time taken by an analysis by displaying the statistics of each analyzer.
- Analyzer Ingress took 47.125583ms
- Analyzer PersistentVolumeClaim took 53.009167ms
- Analyzer CronJob took 57.517792ms
- Analyzer Deployment took 156.6205ms
- Analyzer Node took 160.109833ms
- Analyzer ReplicaSet took 245.938333ms
- Analyzer StatefulSet took 448.0455ms
- Analyzer Pod took 5.662594708s
- Analyzer Service took 38.583359166s

诊断信息

要收集诊断信息，请使用以下命令在本地目录中创建dump_<timestamp>.json文件：

k8sgpt dump

LLM AI后端

当使用--explain标志（例如k8sgpt analyze --explain）解释分析结果时，K8sGPT会使用选定的LLM生成式AI提供商。可使用--backend标志指定已配置的提供商（默认是openai）。

可使用k8sgpt auth list列出可用提供商：

Default:
> openai
Active:
Unused:
> openai
> localai
> ollama
> azureopenai
> cohere
> amazonbedrock
> amazonsagemaker
> google
> huggingface
> noopai
> googlevertexai
> watsonxai
> customrest
> ibmwatsonxai

有关如何配置和使用每个提供商的详细文档，请参见此处。

设置新的默认提供商

k8sgpt auth default -p azureopenai
Default provider set to azureopenai

使用带推理配置文件的Amazon Bedrock Converse

系统推理配置文件

k8sgpt auth add --backend amazonbedrockconverse --providerRegion us-east-1 --model arn:aws:bedrock:us-east-1:123456789012:inference-profile/my-inference-profile

应用推理配置文件

k8sgpt auth add --backend amazonbedrockconverse --providerRegion us-east-1 --model arn:aws:bedrock:us-east-1:123456789012:application-inference-profile/2uzp4s0w39t6

使用带推理配置文件的Amazon Bedrock

系统推理配置文件

k8sgpt auth add --backend amazonbedrock --providerRegion us-east-1 --model arn:aws:bedrock:us-east-1:123456789012:inference-profile/my-inference-profile

应用推理配置文件

k8sgpt auth add --backend amazonbedrock --providerRegion us-east-1 --model arn:aws:bedrock:us-east-1:123456789012:application-inference-profile/2uzp4s0w39t6

关键特性

通过此选项，数据在发送到AI后端前会进行脱敏处理。在分析执行期间，k8sgpt会检索敏感数据（Kubernetes对象名称、标签等）。这些数据在发送到AI后端时会被 masking（替换为密钥），并在解决方案返回给用户时使用该密钥进行去脱敏。

脱敏流程

分析期间报告的错误：

Error: HorizontalPodAutoscaler uses StatefulSet/fake-deployment as ScaleTargetRef which does not exist.

发送到AI后端的 payload：

Error: HorizontalPodAutoscaler uses StatefulSet/tGLcCRcHa1Ce5Rs as ScaleTargetRef which does not exist.

AI返回的 payload：

The Kubernetes system is trying to scale a StatefulSet named tGLcCRcHa1Ce5Rs using the HorizontalPodAutoscaler, but it cannot find the StatefulSet. The solution is to verify that the StatefulSet name is spelled correctly and exists in the same namespace as the HorizontalPodAutoscaler.

返回给用户的 payload：

The Kubernetes system is trying to scale a StatefulSet named fake-deployment using the HorizontalPodAutoscaler, but it cannot find the StatefulSet. The solution is to verify that the StatefulSet name is spelled correctly and exists in the same namespace as the HorizontalPodAutoscaler.

谨慎操作

K8gpt团队建议在关键生产环境中使用完全不同的后端**（本地模型）**。通过使用本地模型，您可以确保所有内容都保留在DMZ内，不会发生任何数据泄露。
如果对于向公共LLM（如OpenAI、Azure AI）发送数据的可能性存在任何不确定性，且这对业务关键操作构成风险，那么在这种情况下，应根据个人评估和相关风险的管辖范围避免使用公共LLM。

配置管理

k8sgpt 将配置数据存储在 $XDG_CONFIG_HOME/k8sgpt/k8sgpt.yaml 文件中。数据以明文形式存储，包括您的OpenAI密钥。

配置文件位置：

操作系统	路径
MacOS	~/Library/Application Support/k8sgpt/k8sgpt.yaml
Linux	~/.config/k8sgpt/k8sgpt.yaml
Windows	%LOCALAPPDATA%/k8sgpt/k8sgpt.yaml

在某些场景下，可能更倾向于远程缓存。在这些场景中，K8sGPT支持AWS S3或Azure Blob存储集成。

远程缓存

[!NOTE] 一次只能配置和使用一个远程缓存

添加远程缓存

AWS S3
- 前提条件：需要将 AWS_ACCESS_KEY_ID 和 AWS_SECRET_ACCESS_KEY 作为环境变量。
- 配置命令：k8sgpt cache add s3 --region <区域> --bucket <桶名称>
- 使用HTTP端点的Minio配置：k8sgpt cache add s3 --bucket <桶名称> --endpoint <http://minio-endpoint>
- 使用HTTPS端点的Minio配置（跳过TLS验证）：k8sgpt cache add s3 --bucket <桶名称> --endpoint <https://minio-endpoint> --insecure
- 如果桶不存在，K8sGPT将创建该桶
Azure存储
- 我们支持多种身份验证方法来向Azure进行身份验证
- 配置命令：k8sgpt cache add azure --storageacc <存储账户名称> --container <容器名称>
- K8sGPT假设存储账户已存在，如果容器不存在，它将创建该容器
- 用户有责任为其身份授予特定权限，以便能够上传Blob文件和创建存储账户容器（例如，Storage Blob Data Contributor角色）
Google Cloud Storage
- 前提条件：需要将 GOOGLE_APPLICATION_CREDENTIALS 作为环境变量。
- 配置命令：k8sgpt cache add gcs --region <区域> --bucket <桶名称> --projectid <项目ID>
- 如果桶不存在，K8sGPT将创建该桶

列出缓存项

k8sgpt cache list

从缓存中清除对象

[!NOTE] 使用此命令清除对象将删除上游文件，因此需要适当的权限。

k8sgpt cache purge $OBJECT_NAME

移除远程缓存

[!NOTE] 这不会删除上游S3桶或Azure存储容器

k8sgpt cache remove

自定义分析器

在某些场景下，您可能希望用自己选择的语言编写自定义分析器。K8sGPT现在支持通过遵循https://github.com/k8sgpt-ai/schemas/blob/main/protobuf/schema/v1/custom_analyzer.proto%E5%B9%B6%E6%8F%90%E4%BE%9B%E5%88%86%E6%9E%90%E5%99%A8%E6%9C%8D%E5%8A%A1%E6%9D%A5%E5%AE%9E%E7%8E%B0%E8%BF%99%E4%B8%80%E7%82%B9%E3%80%82

为此，在K8sGPT配置中定义分析器，它将被添加到扫描流程中。此外，您需要在分析时启用以下标志：

k8sgpt analyze --custom-analysis

以下是一个用https://github.com/k8sgpt-ai/host-analyzer%E7%BC%96%E5%86%99%E7%9A%84%E6%9C%AC%E5%9C%B0%E4%B8%BB%E6%9C%BA%E5%88%86%E6%9E%90%E5%99%A8%E7%A4%BA%E4%BE%8B%E3%80%82%E5%BD%93%E5%AE%83%E5%9C%A8 localhost:8080 上运行时，K8sGPT配置可以通过添加以下内容来获取它：

custom_analyzers:
- name: host-analyzer
  connection:
    url: localhost
    port: 8080

这使得能够将主机操作系统信息（来自此分析器示例）传递给K8sGPT，作为常规分析的上下文。

有关如何编写自定义分析器的文档，请参见

列出已配置的自定义分析器

k8sgpt custom-analyzer list

添加未安装的自定义分析器

k8sgpt custom-analyzer add --name my-custom-analyzer --port 8085

移除自定义分析器

k8sgpt custom-analyzer remove --names "my-custom-analyzer,my-custom-analyzer-2"

模型上下文协议（MCP）

K8sGPT提供模型上下文协议（MCP）服务器，将Kubernetes操作作为标准化工具公开，供Claude、***和其他MCP兼容客户端等AI助手使用。

启动MCP服务器：

标准输入输出模式（适用于本地AI助手）：

k8sgpt serve --mcp

HTTP模式（适用于网络访问）：

k8sgpt serve --mcp --mcp-http --mcp-port 8089

功能：

12种用于集群分析、资源管理和调试的工具
3种用于集群信息访问的资源
3个交互式故障排除提示
用于一次性调用的无状态HTTP模式
与Claude Desktop和其他MCP客户端完全集成

了解更多： 参见 MCP.md 获取完整文档、使用示例和集成指南。

文档

官方文档可在此处获取。

贡献

请阅读我们的贡献指南。

社区

在 Slack 上加入我们。

轩辕镜像配置手册

探索更多轩辕镜像的使用方法，找到最适合您系统的配置方式

Docker 配置

登录仓库拉取

通过 Docker 登录认证访问私有仓库

专属域名拉取

无需登录使用专属域名

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

Dev Containers

VS Code Dev Containers 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

Harbor 镜像源配置

Harbor Proxy Repository 对接专属域名

Portainer 镜像源配置

Portainer Registries 加速拉取

Nexus 镜像源配置

Nexus3 Docker Proxy 内网缓存

系统配置

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

MacOS OrbStack

MacOS OrbStack 容器配置

Docker Compose

Docker Compose 项目配置

NAS 设备

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

极空间

极空间 NAS 系统配置服务

网络设备

爱快路由

爱快 iKuai 路由系统配置

宝塔面板

在宝塔面板一键配置镜像

需要其他帮助？请查看我们的常见问题Docker 镜像访问常见问题解答或提交工单

镜像拉取常见问题

使用与功能问题

配置了专属域名后，docker search 为什么会报错？

docker search 限制

Docker Hub 上有的镜像，为什么在轩辕镜像网站搜不到？

站内搜不到镜像

机器不能直连外网时，怎么用 docker save / load 迁镜像？

离线 save/load

docker pull 拉插件报错（plugin v1+json）怎么办？

插件要用 plugin install

WSL 里 Docker 拉镜像特别慢，怎么排查和优化？

WSL 拉取慢

轩辕镜像安全吗？如何用 digest 校验镜像没被篡改？

安全与 digest

第一次用轩辕镜像拉 Docker 镜像，要怎么登录和配置？

新手拉取配置

轩辕镜像合规吗？轩辕镜像的合规是怎么做的？

镜像合规机制

轩辕镜像支持 docker push 上传本地镜像吗？

不支持 push

错误码与失败问题

docker pull 提示 manifest unknown 怎么办？

manifest unknown

docker pull 提示 no matching manifest 怎么办？

no matching manifest（架构）

镜像已拉取完成，却提示 invalid tar header 或 failed to register layer 怎么办？

invalid tar header（解压）

Docker pull 时 HTTPS / TLS 证书验证失败怎么办？

TLS 证书失败

Docker pull 时 DNS 解析超时或连不上仓库怎么办？

DNS 超时

docker 无法连接轩辕镜像域名怎么办？

域名连通性排查

Docker 拉取出现 410 Gone 怎么办？

410 Gone 排查

出现 402 或「流量用尽」提示怎么办？

402 与流量用尽

Docker 拉取提示 UNAUTHORIZED（401）怎么办？

401 认证失败

遇到 429 Too Many Requests（请求太频繁）怎么办？

429 限流

docker login 提示 Cannot autolaunch D-Bus，还算登录成功吗？

D-Bus 凭证提示

为什么会出现「单层超过 20GB」或 413，无法加速拉取？

413 与超大单层

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别？

免费版与专业版区别

轩辕镜像支持哪些 Docker 镜像仓库？

支持的镜像仓库

镜像拉取失败还会不会扣流量？

失败是否计费

麒麟 V10 / 统信 UOS 提示 KYSEC 权限不够怎么办？

KYSEC 拦截脚本

如何在轩辕镜像申请开具发票？

申请开票

怎么修改轩辕镜像的网站登录和仓库登录密码？

修改登录密码

如何注销轩辕镜像账户？要注意什么？

注销账户

配置与原理类

写了 registry-mirrors，为什么还是走官方或仍然报错？

mirrors 不生效

怎么用 docker tag 去掉镜像名里的轩辕域名前缀？

去掉域名前缀

如何拉取指定 CPU 架构的镜像（如 ARM64、AMD64）？

指定架构拉取

用轩辕镜像拉镜像时快时慢，常见原因有哪些？

拉取速度原因

为什么拉取镜像的 :latest 标签，拿到的往往不是「最新」镜像？

latest 与「最新」

查看全部问题→

用户好评

来自真实用户的反馈，见证轩辕镜像的优质服务

oldzhang

运维工程师

Linux服务器

"Docker访问体验非常流畅，大镜像也能快速完成下载。"

ghcr.io/k8sgpt-ai/k8sgpt:v0.4.27

目录

CLI 安装

Linux/Mac 通过 brew

Windows

Operator 安装

快速开始

示例：

LLM AI后端

关键特性

更多详情

谨慎操作

配置管理

远程缓存

添加远程缓存

列出缓存项

从缓存中清除对象

移除远程缓存

自定义分析器

列出已配置的自定义分析器

添加未安装的自定义分析器

移除自定义分析器

模型上下文协议（MCP）

文档

贡献

社区

轩辕镜像配置手册

Docker 配置

登录仓库拉取

专属域名拉取

K8s Containerd

K3s

Dev Containers

Podman

Singularity/Apptainer

其他仓库配置

Harbor 镜像源配置

Portainer 镜像源配置

Nexus 镜像源配置

系统配置

Linux

Windows/Mac

MacOS OrbStack

Docker Compose

NAS 设备

群晖

飞牛

绿联

威联通

极空间

网络设备

爱快路由

宝塔面板

镜像拉取常见问题

使用与功能问题

配置了专属域名后，docker search 为什么会报错？

Docker Hub 上有的镜像，为什么在轩辕镜像网站搜不到？

机器不能直连外网时，怎么用 docker save / load 迁镜像？

docker pull 拉插件报错（plugin v1+json）怎么办？

WSL 里 Docker 拉镜像特别慢，怎么排查和优化？

轩辕镜像安全吗？如何用 digest 校验镜像没被篡改？

第一次用轩辕镜像拉 Docker 镜像，要怎么登录和配置？

轩辕镜像合规吗？轩辕镜像的合规是怎么做的？

轩辕镜像支持 docker push 上传本地镜像吗？

错误码与失败问题

docker pull 提示 manifest unknown 怎么办？

docker pull 提示 no matching manifest 怎么办？

镜像已拉取完成，却提示 invalid tar header 或 failed to register layer 怎么办？

Docker pull 时 HTTPS / TLS 证书验证失败怎么办？

Docker pull 时 DNS 解析超时或连不上仓库怎么办？

docker 无法连接轩辕镜像域名怎么办？

Docker 拉取出现 410 Gone 怎么办？

出现 402 或「流量用尽」提示怎么办？

Docker 拉取提示 UNAUTHORIZED（401）怎么办？

遇到 429 Too Many Requests（请求太频繁）怎么办？

docker login 提示 Cannot autolaunch D-Bus，还算登录成功吗？

为什么会出现「单层超过 20GB」或 413，无法加速拉取？

账号 / 计费 / 权限

轩辕镜像免费版和专业版有什么区别？

轩辕镜像支持哪些 Docker 镜像仓库？