架构
Kubeflow 模型注册中心的参考文档
注意
模型注册中心是一个被动的元数据存储库,并非旨在成为控制平面。它不执行任何主动协调或暴露 API 来对底层 Kubernetes 组件执行操作。Kubeflow 模型注册中心使用 Google 社区项目 ML-Metadata 作为其核心组件之一。ML-Metadata 提供了一个高度可扩展的通用模式,类似于键值存储,但同时也允许创建逻辑模式,这些模式可以像查询物理模式一样进行查询。这些模式可以使用 Python 库中的绑定进行操作。此模型已扩展,为模型注册中心提供元数据管理服务功能。
模型注册中心直接使用 ml-metadata 项目的 C++ 服务器来处理元数据的存储,而特定领域的模型注册中心功能则作为扩展(微服务)添加。作为这些扩展的一部分,模型注册中心提供
- Python/Go 扩展以支持模型注册中心交互
- 一个 OpenAPI 接口,用于向客户端暴露模型注册中心 API
组件
这是 Google ml-metadata 项目的元数据服务器。此组件托管用于与存储模型实际元数据的后端关系数据库通信。该服务器暴露一个“gRPC”接口供其客户端通信。该服务器提供一个非常灵活的模式模型,使用此模型可以定义逻辑数据模型,以适应不同 MLOps 操作的需求,例如,训练和实验期间的元数据、关于指标或模型版本控制的元数据等。
此组件暴露模型注册中心更高层次的 REST API。相比之下,MLMD 服务器通过 gRPC 暴露较低层次的通用 API,而此 REST 服务器则暴露更高层次的 API,该 API 更接近模型注册中心的领域模型,例如
- 注册模型
- 模型版本化
- 获取模型目录
- 管理模型的部署状态
REST API 服务器将其请求转换为 MLMD 服务器上的一个或多个底层 gRPC 请求。
CLI 也称为 MR Python 客户端/SDK,是一个与模型注册中心交互的命令行工具。用户可以使用此工具执行操作,例如检索已注册的模型、获取模型的部署状态、模型的版本等。
模型注册中心提供了从通过 OpenAPI/REST 服务器可用的高层级逻辑模型到底层 ml-metadata 实体的逻辑映射。
另请参阅
- 模型注册中心项目文档。
最后修改于 2025年3月29日: website: 添加深色主题 (#3981) (4f092f1)