概述
什么是 Kubeflow Pipelines?
Kubeflow Pipelines (KFP) 是一个平台,用于在基于 Kubernetes 的系统上使用容器构建和部署可移植、可扩展的机器学习 (ML) 工作流。
使用 KFP,您可以使用 KFP Python SDK 创作 组件 和 流水线,将流水线编译为 中间表示 YAML,并将流水线提交到符合 KFP 的后端运行,例如 开源 KFP 后端 或 Google Cloud Vertex AI Pipelines。
开源 KFP 后端可作为 Kubeflow 的核心组件使用,也可作为独立安装。要将 KFP 作为 Kubeflow 平台的一部分使用,请按照 安装 Kubeflow 的说明进行操作。要将 KFP 作为独立应用程序使用,请按照 独立安装 说明进行操作。要开始您的第一个流水线,请按照 入门 说明进行操作。
为什么选择 Kubeflow Pipelines?
KFP 使数据科学家和机器学习工程师能够
- 使用 Python 原生地创作端到端 ML 工作流
- 创建完全自定义的 ML 组件或利用现有的组件生态系统
- 轻松地在流水线组件之间传递参数和 ML 工件
- 轻松管理、跟踪和可视化流水线定义、运行、实验和 ML 工件
- 通过并行任务执行和缓存来高效使用计算资源,消除冗余执行
- 保持实验和迭代的轻量化和以 Python 为中心,最大限度地减少(重新)构建和维护容器的需求
- 通过平台中立的 IR YAML 流水线定义 保持跨平台流水线可移植性
什么是流水线?
一个 流水线 是一个工作流定义,它将一个或多个 组件 组合在一起,形成一个计算有向无环图 (DAG)。在运行时,每个组件的执行对应于一次容器执行,这可能会创建 ML 工件。流水线还可以包含 控制流。
下一步
- 安装 Kubeflow Pipelines
- 入门
- 了解更多关于 创作组件 的信息
- 了解更多关于 创作流水线 的信息
最后修改于 2025年4月25日: 修复:入门页面链接断开 (#4091) (239078a)