安装
如何安装 Katib
本指南介绍如何在 Kubernetes 集群上安装 Katib。
先决条件
以下是安装 Katib 的最低要求。
- Kubernetes >= 1.27
kubectl
>= 1.27- Python >= 3.7
安装 Katib
您需要安装 Katib 控制平面和 Python SDK 来创建 Katib Experiments。
安装控制平面
如果您已经使用 manifests 或包分发版本安装了 Kubeflow 平台,则可以跳过这些步骤。Kubeflow 平台包括 Katib。
您可以将 Katib 作为独立组件安装。
运行以下命令安装 Katib 控制平面的稳定版本:v0.17.0
kubectl apply -k "github.com/kubeflow/katib.git/manifests/v1beta1/installs/katib-standalone?ref=v0.17.0"
运行以下命令安装 Katib 控制平面的最新更改
kubectl apply -k "github.com/kubeflow/katib.git/manifests/v1beta1/installs/katib-standalone?ref=master"
安装后,您可以验证所有Katib 控制平面组件是否正在运行
$ kubectl get pods -n kubeflow
NAME READY STATUS RESTARTS AGE
katib-controller-566595bdd8-8w7sx 1/1 Running 0 82s
katib-db-manager-57cd769cdb-vt7zs 1/1 Running 0 82s
katib-mysql-7894994f88-djp7m 1/1 Running 0 81s
katib-ui-5767cfccdc-v9fcs 1/1 Running 0 80s
注意。您的 Kubernetes 集群必须具有用于 Katib DB 的动态卷配置的 StorageClass
。有关更多信息,请查阅 Kubernetes 文档中关于动态配置的部分。如果您的集群没有动态卷配置,则必须手动部署PersistentVolume (PV)来绑定 Katib DB 组件的PVC。
安装 Python SDK
Katib 实现了 Python SDK,以简化数据科学家创建 Katib Experiments 的过程。
运行以下命令安装 Katib SDK 的最新稳定版本
pip install -U kubeflow-katib
运行以下命令安装 Katib SDK 的最新更改
pip install git+https://github.com/kubeflow/katib.git@master#subdirectory=sdk/python/v1beta1
否则,您也可以使用特定的 GitHub commit 安装 Katib SDK,例如
pip install git+https://github.com/kubeflow/katib.git@ea46a7f2b73b2d316b6b7619f99eb440ede1909b#subdirectory=sdk/python/v1beta1
下一步
按照入门指南运行您的第一个 Katib Experiment。
了解安装 Katib 控制平面组件的各种选项。
最后修改于 2024 年 10 月 21 日:Training: Update example to run PyTorchJob with torchrun (#3896) (aae74a5)