notebook-controller 是 Kubeflow 机器学习平台生态中的核心组件,主要用于在 Kubernetes 集群上管理 Jupyter Notebook 的全生命周期。它通过 Kubernetes 自定义资源(CRD)将 Notebook 实例转化为可编排的集群资源,实现从创建、运行到销毁的自动化管理,是连接数据科学家日常使用的 Notebook 工具与容器化集群的关键桥梁。
在实际使用中,用户只需通过 YAML 配置文件或 Kubeflow UI 提交 Notebook 实例的需求(如镜像版本、资源规格、存储配置等),notebook-controller 会自动完成后续所有操作:包括基于配置创建 Notebook Pod、调度到合适的 Kubernetes 节点、分配 CPU/内存/GPU 等计算资源,以及实时监控实例运行状态(如运行中、暂停、异常等)。若实例出现故障(如节点宕机),控制器还能自动触发重启或重新调度,保障 Notebook 服务的稳定性。
针对机器学习开发的特殊性,notebook-controller 设计了多项实用功能:
在传统模式下,手动在 Kubernetes 上部署 Notebook 需处理镜像拉取、Pod 调度、资源配置等细节,操作繁琐且易出错。notebook-controller 将这些流程自动化,数据科学家无需关注底层集群细节,只需专注代码开发和模型实验;同时,企业级 ML 平台管理员可通过控制器统一管控所有 Notebook 实例,实现资源配额管理、使用审计等运维需求。
总之,notebook-controller 作为 Kubeflow 的“Notebook 管家”,通过容器化和自动化手段,让 Jupyter Notebook 从本地工具升级为集群级共享资源,既降低了 ML 开发环境的管理成本,又提升了团队协作效率,是构建企业级机器学习平台的重要基础设施。
请登录使用轩辕镜像享受快速拉取体验,支持国内访问优化,速度提升
docker pull ghcr.io/kubeflow/kubeflow/notebook-controller:v1.10.0探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务