安装
如何安装 Katib
本指南介绍如何在 Kubernetes 集群上安装 Katib。
先决条件
以下是安装 Katib 的最低要求。
- Kubernetes >= 1.27
kubectl>= 1.27- Python >= 3.7
安装 Katib
您需要安装 Katib 控制平面和 Python SDK 来创建 Katib Experiments。
安装控制平面
如果您已经使用 manifests 或包分发版本安装了 Kubeflow 平台,则可以跳过这些步骤。Kubeflow 平台包括 Katib。
您可以将 Katib 作为独立组件安装。
运行以下命令安装 Katib 控制平面的稳定版本:v0.17.0
kubectl apply -k "github.com/kubeflow/katib.git/manifests/v1beta1/installs/katib-standalone?ref=v0.17.0"
运行以下命令安装 Katib 控制平面的最新更改
kubectl apply -k "github.com/kubeflow/katib.git/manifests/v1beta1/installs/katib-standalone?ref=master"
安装后,您可以验证所有Katib 控制平面组件是否正在运行
$ kubectl get pods -n kubeflow
NAME READY STATUS RESTARTS AGE
katib-controller-566595bdd8-8w7sx 1/1 Running 0 82s
katib-db-manager-57cd769cdb-vt7zs 1/1 Running 0 82s
katib-mysql-7894994f88-djp7m 1/1 Running 0 81s
katib-ui-5767cfccdc-v9fcs 1/1 Running 0 80s
注意。您的 Kubernetes 集群必须具有用于 Katib DB 的动态卷配置的 StorageClass。有关更多信息,请查阅 Kubernetes 文档中关于动态配置的部分。如果您的集群没有动态卷配置,则必须手动部署PersistentVolume (PV)来绑定 Katib DB 组件的PVC。
安装 Python SDK
Katib 实现了 Python SDK,以简化数据科学家创建 Katib Experiments 的过程。
运行以下命令安装 Katib SDK 的最新稳定版本
pip install -U kubeflow-katib
运行以下命令安装 Katib SDK 的最新更改
pip install git+https://github.com/kubeflow/katib.git@master#subdirectory=sdk/python/v1beta1
否则,您也可以使用特定的 GitHub commit 安装 Katib SDK,例如
pip install git+https://github.com/kubeflow/katib.git@ea46a7f2b73b2d316b6b7619f99eb440ede1909b#subdirectory=sdk/python/v1beta1
下一步
按照入门指南运行您的第一个 Katib Experiment。
了解安装 Katib 控制平面组件的各种选项。
最后修改于 2024 年 10 月 21 日:Training: Update example to run PyTorchJob with torchrun (#3896) (aae74a5)