跳到主要内容

MLflow 模型注册表

MLflow 模型注册中心是一个集中的模型存储、一组 API 和一个用户界面,旨在协同管理模型的完整生命周期。它提供血缘关系(即哪个 MLflow 实验和运行产生了该模型)、版本控制、别名、元数据标记和注释支持,以确保您在从开发到生产部署的每个阶段都拥有完整的信息。

为什么需要模型注册中心?

随着机器学习项目复杂性和规模的增长,在不同环境、团队和迭代中手动管理模型变得越来越容易出错且效率低下。MLflow 模型注册中心通过提供一个集中的、结构化的系统来组织和治理 ML 模型在其整个生命周期中的管理,从而解决了这一挑战。

使用模型注册中心具有以下好处

  • 🗂️ 版本控制:注册中心自动跟踪每个模型的版本,允许团队比较迭代、回滚到以前的状态以及并行管理多个版本(例如,分期与生产)。
  • 🧬 模型血缘和可追溯性:每个注册的模型版本都链接到生成它的 MLflow 运行、记录的模型或笔记本,从而实现完全的可复现性。您可以确切追溯模型是如何用哪些数据和参数训练出来的。
  • 🚀 生产就绪的工作流程:模型别名(例如 `@champion`)和标签等功能使管理部署工作流程变得更容易,以受控和可审计的方式将模型提升到实验、分期或生产环境。
  • 🛡️ 治理和合规性:通过结构化的元数据、标记和基于角色的访问控制(当与 Databricks 或托管 MLflow 服务等后端一起使用时),模型注册中心支持企业级 ML 运营所需的治理要求。

无论您是独立的数据科学家还是大型 ML 平台团队的一员,模型注册中心都是扩展可靠且可维护的机器学习系统的基础组件。

概念

模型注册中心引入了一些概念,用于描述和促进 MLflow 模型的完整生命周期。

概念描述
模型

MLflow 模型是通过模型类型之一的 mlflow.<model_flavor>.log_model() 方法或自 MLflow 3 以来引入的 mlflow.create_external_model() API 创建的。记录后,此模型可以注册到模型注册中心。

注册模型

MLflow 模型可以注册到模型注册中心。注册模型具有唯一的名称,包含版本、别名、标签和其他元数据。

模型版本

每个注册模型可以有一个或多个版本。当一个新模型添加到模型注册中心时,它被添加为版本 1。注册到同一模型名称的每个新模型都会**递增版本号**。模型版本具有标签,可用于跟踪模型版本的属性(例如 *pre_deploy_checks: "PASSED"*)

模型 URI

您可以使用以下格式的 URI 来引用注册模型:models:/<model-name>/<model-version>,例如,如果您有一个名为“MyModel”且版本为 1 的注册模型,则引用该模型的 URI 为:models:/MyModel/1”。

模型别名

模型别名允许您为注册模型的特定版本分配一个可变的、命名的引用。通过将别名分配给特定的模型版本,您可以使用该别名通过模型 URI 或模型注册中心 API 来引用该模型版本。例如,您可以创建一个名为 champion 的别名,指向名为 MyModel 的模型的版本 1。然后,您可以使用 URI models:/MyModel@champion 来引用 MyModel 的版本 1。

别名在部署模型时特别有用。例如,您可以将 champion 别名分配给旨在处理生产流量的模型版本,并在生产工作负载中定位此别名。然后,您可以通过将 champion 别名重新分配给不同的模型版本来更新服务生产流量的模型。

标签

标签是您与注册模型和模型版本关联的键值对,允许您按功能或状态标记和分类它们。例如,您可以将键为 "task"、值为 "question-answering" 的标签(在 UI 中显示为 task:question-answering)应用于旨在用于问答任务的注册模型。在模型版本级别,您可以标记正在进行部署前验证的版本为 validation_status:pending,标记已获批准部署的版本为 validation_status:approved

注释和描述

您可以使用 Markdown 为顶级模型和每个单独的版本添加注释,包括描述和对团队有用的任何相关信息,例如算法描述、使用的数据集或给定版本建模方法所涉及的总体方法。

模型注册中心实践

MLflow 模型注册中心在开源 (OSS) MLflow 和 Databricks 等托管平台上均可用。根据环境的不同,注册中心提供不同级别的集成、治理和协作功能。

OSS MLflow 中的模型注册中心

在 MLflow 的开源版本中,模型注册中心提供用户界面 (UI) 和 API 来管理机器学习模型的生命周期。您可以注册模型、跟踪版本、添加标签和描述,并将模型在阶段(如 Staging 和 Production)之间转换。

在 MLflow 中注册模型

使用 MLflow Python API 注册模型

MLflow 提供了几种注册模型版本的方式

text
# Option 1: specify `registered_model_name` parameter when logging a model
mlflow.<flavor>.log_model(..., registered_model_name="<YOUR_MODEL_NAME>")

# Option 2: register a logged model
mlflow.register_model(model_uri="<YOUR_MODEL_URI>", name="<YOUR_MODEL_NAME>")

注册模型后,您可以使用模型名称和版本将其加载回来

text
mlflow.<flavor>.load_model("models:/<YOUR_MODEL_NAME>/<YOUR_MODEL_VERSION>")

要了解有关 OSS 模型注册中心的更多信息,请参阅模型注册中心教程

Databricks 中的模型注册中心

Databricks 通过将模型注册中心与 Unity Catalog 集成来扩展 MLflow 的功能,从而实现集中治理、细粒度访问控制和跨工作区协作。

Unity Catalog 集成的关键优势包括

  • 🛡️ 增强的治理:对模型资产应用访问策略和权限控制。
  • 🌐 跨工作区访问:一次注册模型,即可在多个 Databricks 工作区中访问它们。
  • 🔗 模型血缘:跟踪用于创建每个模型所使用的笔记本、数据集和实验。
  • 🔍 发现和重用:从共享目录中浏览和重用生产级模型。
在 Databricks UC 中注册模型

使用 MLflow Python API 将模型注册到 Databricks UC

先决条件:将跟踪 URI 设置为 Databricks

python
import mlflow

mlflow.set_registry_uri("databricks-uc")

使用 MLflow API 注册模型

text
# Option 1: specify `registered_model_name` parameter when logging a model
mlflow.<flavor>.log_model(..., registered_model_name="<YOUR_MODEL_NAME>")

# Option 2: register a logged model
mlflow.register_model(model_uri="<YOUR_MODEL_URI>", name="<YOUR_MODEL_NAME>")
警告

UC 中的 ML 模型版本必须具有模型签名。如果您想为已记录或保存的模型设置签名,可以使用 mlflow.models.set_signature() API。

注册模型后,您可以使用模型名称和版本将其加载回来

text
mlflow.<flavor>.load_model("models:/<YOUR_MODEL_NAME>/<YOUR_MODEL_VERSION>")

有关更多信息,请参阅Databricks 文档中关于管理模型生命周期的内容。