如何使用 Kubeflow 微调 LLMs
Training Operator 中 LLM 微调 API 概述
本页面介绍的是 Kubeflow Training Operator V1,最新信息请查看 Kubeflow Trainer V2 文档。
Training Operator 中 LLM 微调 API 概述
使用 PyTorchJob 训练 PyTorch 模型
使用 TFJob 训练 TensorFlow 模型
使用 PaddleJob 训练 PaddlePaddle 模型
使用 XGBoostJob 训练 XGBoost 模型
使用 JAXJob 训练 JAX 模型
如何使用 gang-scheduling 调度作业
使用 MPI 进行训练的说明
Training Operator 的 Prometheus 指标