专属
文档
插件
助手
邀请
顶部
快速返回页面顶部
收起
收起工具栏
轩辕镜像 官方专业版
轩辕镜像
专业版
轩辕镜像 官方专业版
轩辕镜像
专业版
首页个人中心搜索镜像

交易
充值流量我的订单

文档

工具

功能
提交工单页面收录

帮助
轩辕镜像免费版

其他
关于我们网站地图
热门搜索:
checkpoint-restore-operator

criu/checkpoint-restore-operator

criu

用于管理检查点的Kubernetes操作器,提供在Kubernetes集群中自动化创建、存储、恢复和删除容器检查点的能力。

下载次数: 0状态:社区镜像维护者:criu仓库类型:镜像最近更新:15 天前
让 AI 帮你使用轩辕镜像? · 展开查看说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可:

请先完整阅读并严格遵守以下文档中的全部规则与要求:

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。

中文简介
标签列表
镜像标签列表与下载命令
轩辕镜像,加速的不只是镜像。
点击查看

检查点管理Kubernetes操作器

镜像概述

本镜像包含一个Kubernetes操作器(Operator),专门用于在Kubernetes集群中管理容器检查点(Container Checkpoints)的全生命周期。作为Kubernetes的自定义控制器,该操作器通过自定义资源定义(CRD)扩展Kubernetes API,提供检查点创建、存储、恢复和清理的自动化能力,简化有状态应用的状态管理流程。

核心功能与特性

主要功能

  • 检查点自动化创建:支持基于时间策略(如定时)或事件触发(如Pod重启前)自动创建容器检查点
  • 多存储后端支持:兼容Kubernetes持久卷(PVC)、对象存储(如S3)及本地存储等多种检查点存储方式
  • 检查点恢复机制:提供从保存的检查点快速恢复容器状态的能力,支持原Pod恢复或新Pod重建
  • 生命周期管理:自动清理过期或超出保留策略的检查点,释放集群存储资源
  • 状态监控与告警:集成Prometheus指标,监控检查点创建/恢复状态,支持异常状态告警

关键特性

  • 声明式API:通过Checkpoint和CheckpointPolicy自定义资源实现声明式配置
  • 无侵入集成:无需修改应用容器镜像,通过Kubernetes运行时接口(CRI)与容器运行时交互
  • 高可用性:支持多副本部署,确保操作器本身的故障容错
  • 可扩展性:模块化设计,支持添加新的存储后端或检查点处理逻辑

使用场景与适用范围

典型使用场景

  • 有状态应用故障恢复:数据库、消息队列等有状态应用发生故障时,从最近检查点恢复状态,减少数据丢失
  • 资源密集型任务状态保存:AI训练、科学计算等长时间任务,定期保存检查点避免任务中断后重新计算
  • 测试环境状态复现:在测试或调试过程中,保存特定场景的容器状态,支持精确复现问题环境
  • 集群迁移/升级:在Kubernetes集群版本升级或节点迁移前,为关键应用创建检查点,确保升级失败时可快速回滚

适用范围

  • Kubernetes集群版本:v1.21+(需支持CRD v1和Operator SDK依赖的API)
  • 容器运行时:支持检查点功能的容器运行时(如containerd 1.6+、CRI-O 1.20+)
  • 应用类型:需要状态持久化的有状态容器应用,特别是无法通过传统数据卷完全恢复状态的场景

使用方法与配置说明

前置条件

  • Kubernetes集群已部署,版本v1.21+
  • 容器运行时启用检查点功能(如containerd需配置[plugins."io.containerd.snapshotter.v1.devmapper"]支持)
  • 集群内已安装kubectl命令行工具,并具有集群管理员权限

部署步骤

1. 安装CRD

首先部署检查点管理所需的自定义资源定义:

bash
kubectl apply -f https://raw.githubusercontent.com/example/checkpoint-operator/main/config/crd/bases/checkpoint.example.com_checkpoints.yaml
kubectl apply -f https://raw.githubusercontent.com/example/checkpoint-operator/main/config/crd/bases/checkpoint.example.com_checkpointpolicies.yaml

2. 部署操作器

通过Deployment部署操作器到集群(默认命名空间checkpoint-operator-system):

yaml
# checkpoint-operator-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: checkpoint-operator
  namespace: checkpoint-operator-system
spec:
  replicas: 2
  selector:
    matchLabels:
      control-plane: controller-manager
  template:
    metadata:
      labels:
        control-plane: controller-manager
    spec:
      serviceAccountName: checkpoint-operator-controller-manager
      containers:
      - name: manager
        image: [镜像仓库地址]/checkpoint-operator:v1.0.0
        command:
        - /manager
        args:
        - --leader-elect
        env:
        - name: WATCH_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: OPERATOR_NAME
          value: "checkpoint-operator"
        resources:
          limits:
            cpu: 500m
            memory: 512Mi
          requests:
            cpu: 100m
            memory: 20Mi

应用部署配置:

bash
kubectl apply -f checkpoint-operator-deployment.yaml

3. 创建检查点策略(可选)

定义检查点创建的全局策略(如保留数量、存储位置等):

yaml
# example-checkpoint-policy.yaml
apiVersion: checkpoint.example.com/v1alpha1
kind: CheckpointPolicy
metadata:
  name: default-policy
spec:
  retention:
    maxCount: 5  # 最多保留5个检查点
    maxAge: 72h  # 检查点最长保留72小时
  storage:
    backend: "pvc"  # 使用PVC存储
    pvcTemplate:
      accessModes: ["ReadWriteOnce"]
      resources:
        requests:
          storage: 10Gi

应用策略:

bash
kubectl apply -f example-checkpoint-policy.yaml

4. 创建检查点

为目标Pod创建检查点:

yaml
# example-checkpoint.yaml
apiVersion: checkpoint.example.com/v1alpha1
kind: Checkpoint
metadata:
  name: my-app-checkpoint
spec:
  target:
    podName: my-app-pod-0  # 目标Pod名称
    namespace: default    # 目标Pod所在命名空间
    containerName: main   # 目标容器名称(默认为Pod中第一个容器)
  policyRef: default-policy  # 引用检查点策略(可选)
  storage:
    # 覆盖策略中的存储配置(可选)
    backend: "s3"
    s3:
      endpoint: "s3.example.com"
      bucket: "checkpoints"
      prefix: "my-app/"

创建检查点:

bash
kubectl apply -f example-checkpoint.yaml

检查点恢复操作

通过kubectl命令触发检查点恢复:

bash
kubectl annotate pod my-app-pod-0 checkpoint.example.com/restore-from=my-app-checkpoint

配置参数说明

Checkpoint自定义资源字段

字段路径类型描述是否必填
metadata.namestring检查点资源名称是
spec.target.podNamestring目标Pod名称是
spec.target.namespacestring目标Pod所在命名空间否(默认与当前命名空间相同)
spec.target.containerNamestring目标容器名称否(默认第一个容器)
spec.policyRefstring引用的CheckpointPolicy名称否
spec.storage.backendstring存储后端类型(pvc/s3/local)否(策略中定义则可选)
spec.storage.pvcobjectPVC存储配置(当backend为pvc时)否(策略中定义则可选)
spec.storage.s3objectS3存储配置(当backend为s3时)否(策略中定义则可选)
spec.storage.local.pathstring本地存储路径(当backend为local时)否(策略中定义则可选)

环境变量配置(操作器部署)

环境变量描述默认值
WATCH_NAMESPACE操作器监控的命名空间,多个用逗号分隔,空表示所有命名空间""
OPERATOR_NAME操作器标识名称"checkpoint-operator"
LOG_LEVEL日志级别(debug/info/warn/error)"info"
METRICS_PORTPrometheus指标暴露端口8080
HEALTH_PROBE_PORT健康检查端口8081

监控与故障排查

监控指标

操作器暴露以下Prometheus指标(默认端口8080):

  • checkpoint_operator_checkpoint_total{status="created/failed"}:检查点创建总数
  • checkpoint_operator_restore_total{status="success/failed"}:检查点恢复总数
  • checkpoint_operator_checkpoint_age_seconds:检查点存活时间

常见故障排查

  • 检查点创建失败:查看操作器日志 kubectl logs -l control-plane=controller-manager -n checkpoint-operator-system
  • 存储后端连接错误:验证存储配置(如S3访问密钥、PVC权限)
  • 容器运行时不支持:确认容器运行时已启用检查点功能(如containerd需配置[plugins."io.containerd.grpc.v1.cri".containerd.checkpoint])

版本兼容性

操作器版本支持Kubernetes版本支持容器运行时版本
v1.0.x1.21-1.25containerd 1.6+, CRI-O 1.20+
v1.1.x1.23-1.27containerd 1.7+, CRI-O 1.22+

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

轩辕镜像加速拉取命令点我查看更多 checkpoint-restore-operator 镜像标签

docker pull docker.xuanyuan.run/criu/checkpoint-restore-operator:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

DockerHub 原生拉取命令

docker pull criu/checkpoint-restore-operator:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

一键安装

一键安装 Docker

Linux Docker 一键安装

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

功能

免费版与专业版区别

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

登录 · 专属域名 · 配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest(架构)

账号

失败是否计费

manifest · blob · 计费

申请开发票(企业 / 个人)

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
criu/checkpoint-restore-operator
教程轩辕镜像功能与使用教程
定价查看流量套餐与价格
热门查看热门 Docker 镜像推荐
博客Docker 镜像公告与技术博客
官方公众号:源码跳动|官方技术交流群:831623681
官方公众号:源码跳动|官方技术交流群:|问题咨询请:提交工单
商务合作:点击复制邮箱
©2024-2026 源码跳动
商务合作:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.

更多 checkpoint-restore-operator 镜像推荐

rancher/backup-restore-operator logo

rancher/backup-restore-operator

rancher
暂无描述
3 次收藏500万+ 次下载
7 小时前更新
victoriametrics/operator logo

victoriametrics/operator

victoriametrics
用于在Kubernetes环境中自动化部署、管理和运维Victoria Metrics时序数据库的Operator控制器
1亿+ 次下载
3 天前更新

查看更多 checkpoint-restore-operator 相关镜像