此Web应用负责允许用户在Kubeflow集群中管理KServe推理资源。它提供了一种用户友好的方式来处理InferenceService和InferenceGraph自定义资源的生命周期。
InferenceService资源InferenceGraph资源InferenceService和InferenceGraph均为应用中的一等资源,但目前它们并未共享完全相同的UI界面。
InferenceService仍是主要的模型服务器管理流程,包括主要的列表/详情体验和服务特定的操作视图。InferenceGraph可通过专用的列表、创建、编辑和详情路由访问。InferenceGraph详情目前侧重于图概述、事件和YAML,而非InferenceService的完整操作视图集。Web应用与其他KServe组件一同安装,位于kserve命名空间或kubeflow命名空间中。存在一个VirtualService通过Istio Ingress Gateway暴露应用。根据安装环境,将使用以下Ingress Gateway:
| 安装模式 | Ingress网关 |
|---|---|
| Standalone KServe | knative-ingress-gateway.knative-serving |
| Kubeflow | kubeflow-gateway.kubeflow |
要访问应用,需在浏览器中导航至:
${INGRESS_IP}/models/
或者,可通过kubectl port-forward访问应用。在此情况下,需将应用配置为:
可通过以下命令应用上述配置:
# 编辑配置映射
# CONFIG=manifests/kustomize/overlays/kubeflow/kustomization.yaml
CONFIG=manifests/kustomize/base/kustomization.yaml
vim ${CONFIG}
# 向configMapGenerator的literals添加以下环境变量
# 针对kserve-models-web-app-config
- APP_PREFIX=/
- APP_DISABLE_AUTH="True"
- APP_SECURE_COOKIES="False"
# 重新应用kustomization
# kustomize build manifests/kustomize/overlays/kubeflow | kubectl apply -f -
kustomize build manifests/kustomize/base | kubectl apply -f -
以下是可为此基础应用所构建的任何Web应用设置的环境变量列表:
| 环境变量 | 默认值 | 描述 |
|---|---|---|
| APP_PREFIX | /models | 通过设置base-url元素控制应用的前缀 |
| APP_DISABLE_AUTH | False | 控制应用是否应使用SubjectAccessReviews确保用户有权执行操作 |
| APP_SECURE_COOKIES | True | 控制应用是否应使用安全CSRF Cookie。默认情况下,应用期望通过HTTPS暴露 |
| CSRF_SAMESITE | Strict | 控制CSRF Cookie的SameSite值 |
| USERID_HEADER | kubeflow-userid | 每个请求中包含登录用户名的头部 |
| USERID_PREFIX | "" | 从USERID_HEADER值中移除以提取登录用户名的前缀 |
| GRAFANA_PREFIX | /grafana | 指标仪表板的Grafana端点前缀 |
| GRAFANA_CPU_MEMORY_DB | db/knative-serving-revision-cpu-and-memory-usage | CPU和内存指标的Grafana仪表板名称 |
| GRAFANA_HTTP_REQUESTS_DB | db/knative-serving-revision-http-requests | HTTP请求指标的Grafana仪表板名称 |
| ALLOWED_NAMESPACES | "" | 允许访问的命名空间的逗号分隔列表。若为空,可访问所有命名空间。单个命名空间会自动选择并隐藏下拉菜单 |
对于独立部署,使用ALLOWED_NAMESPACES配置用户可访问的命名空间:
ALLOWED_NAMESPACES="kubeflow-user" - 自动选择,隐藏下拉菜单ALLOWED_NAMESPACES="ns1,ns2,ns3" - 过滤下拉菜单无效命名空间将被忽略;若没有有效命名空间,将回退到所有命名空间。
# 仅允许访问一个命名空间(自动选择,隐藏下拉菜单)
export ALLOWED_NAMESPACES="kubeflow-user"
# 允许访问多个特定命名空间
export ALLOWED_NAMESPACES="kubeflow-user,kubeflow-admin,ml-team"
# 默认行为 - 可访问所有命名空间
unset ALLOWED_NAMESPACES
将环境变量添加到部署配置中:
apiVersion: apps/v1
kind: Deployment
metadata:
name: kserve-models-web-application
spec:
template:
spec:
containers:
- name: kserve-models-web-application
env:
- name: ALLOWED_NAMESPACES
value: "kubeflow-user,kubeflow-admin"
应用支持Grafana端点和仪表板名称的运行时配置,允许使用自定义Grafana实例和仪表板配置,无需重新构建应用。
若使用Kustomize在Kubernetes上部署,可通过编辑manifests/kustomize/base/kustomization.yaml(或您的覆盖层)中kserve-models-web-app-config的configMapGenerator来设置这些值。根据需要更新以下文字值:
编辑后,重新应用清单,例如:
kustomize build manifests/kustomize/base | kubectl apply -f -
可通过访问/api/config端点验证Grafana配置:
curl http://your-app-url/api/config
预期响应:
{
"grafanaPrefix": "/custom-grafana",
"grafanaCpuMemoryDb": "db/custom-cpu-memory-dashboard",
"grafanaHttpRequestsDb": "db/custom-http-requests-dashboard"
}
前端使用Angular构建,后端使用Python Flask框架编写。
此Web应用利用kubeflow/notebooks仓库中的通用代码。我们希望在不同的Kubeflow Web应用中保持相同的用户体验,并使它们处于相同的开发状态。为此,应用将使用此共享通用代码。
这要求在本地构建应用或构建OCI容器镜像时获取此通用代码。
要在本地运行应用,需:
npm run build:watch命令会将前端制品构建到后端的static文件夹中以进行服务。因此,要查看应用,需启动后端并连接到localhost:5000。
cd $KSERVE_MODELS_WEB_APPLICATION_REPOSITORY/frontend
# 设置依赖并构建通用库
make setup
# 可选:指定自定义Kubeflow仓库路径。默认:`../../notebooks`(相对于frontend目录)
# make setup KF_REPO=/path/to/notebooks
# 清理命令:提供make clean目标以移除node_modules
# make clean
# 构建并监视更改
npm run build:watch
# 构建通用库
COMMIT=$(cat ./frontend/COMMIT)
cd $KUBEFLOW_REPOSITORY/components/crud-web-apps/common/frontend/kubeflow-common-lib
git checkout $COMMIT
npm i
npm run build
cd dist/kubeflow
npm link
# 运行应用前端
cd $KSERVE_MODELS_WEB_APPLICATION_REPOSITORY/frontend
npm i
npm link kubeflow
npm run build:watch
# 创建虚拟环境并安装依赖
# https://packaging.python.org/guides/installing-using-pip-and-virtual-environments/
cd $KSERVE_MODELS_WEB_APPLICATION_REPOSITORY/backend
python3.12 -m pip install --user virtualenv
python3.12 -m venv web-application-development
source web-application-development/bin/activate
# 在激活的虚拟环境中安装依赖
KUBEFLOW_REPOSITORY="/path/to/kubeflow/notebooks" make -C backend install-deps
# 运行后端
make -C backend run-dev
具有大型JWT令牌的用户(常见于Azure AD和广泛的组成员身份)可能会遇到请求失败。部署包含Gunicorn配置(GUNICORN_CMD_ARGS=--limit-request-field_size 32000)以处理更大的头部。
有关更多详细信息,请参阅oauth2-proxy已知问题。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
不支持 push
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务