概述

什么是 Kubeflow Pipelines?

Kubeflow Pipelines (KFP) 是一个平台,用于在基于 Kubernetes 的系统上使用容器构建和部署可移植、可扩展的机器学习 (ML) 工作流。

使用 KFP,您可以使用 KFP Python SDK 创作 组件流水线,将流水线编译为 中间表示 YAML,并将流水线提交到符合 KFP 的后端运行,例如 开源 KFP 后端Google Cloud Vertex AI Pipelines

开源 KFP 后端可作为 Kubeflow 的核心组件使用,也可作为独立安装。要将 KFP 作为 Kubeflow 平台的一部分使用,请按照 安装 Kubeflow 的说明进行操作。要将 KFP 作为独立应用程序使用,请按照 独立安装 说明进行操作。要开始您的第一个流水线,请按照 入门 说明进行操作。

为什么选择 Kubeflow Pipelines?

KFP 使数据科学家和机器学习工程师能够

  • 使用 Python 原生地创作端到端 ML 工作流
  • 创建完全自定义的 ML 组件或利用现有的组件生态系统
  • 轻松地在流水线组件之间传递参数和 ML 工件
  • 轻松管理、跟踪和可视化流水线定义、运行、实验和 ML 工件
  • 通过并行任务执行和缓存来高效使用计算资源,消除冗余执行
  • 保持实验和迭代的轻量化和以 Python 为中心,最大限度地减少(重新)构建和维护容器的需求
  • 通过平台中立的 IR YAML 流水线定义 保持跨平台流水线可移植性

什么是流水线?

一个 流水线 是一个工作流定义,它将一个或多个 组件 组合在一起,形成一个计算有向无环图 (DAG)。在运行时,每个组件的执行对应于一次容器执行,这可能会创建 ML 工件。流水线还可以包含 控制流

下一步

反馈

此页面是否有帮助?


最后修改于 2025年4月25日: 修复:入门页面链接断开 (#4091) (239078a)