跳到主要内容

如何运行教程

本简要指南将引导您了解运行这些教程并提供一个用于记录结果的跟踪服务器(同时提供 MLflow UI 的选项)的几种方法。

1. 下载 Notebook

您可以通过点击每个教程页面顶部的“下载 Notebook”按钮来下载教程 Notebook。

2. 安装 MLflow

通过运行以下命令,从 PyPI 安装 MLflow

pip install mlflow
提示

💡 我们建议使用 venvuvPoetry 等工具创建一个新的虚拟环境,以将您的 ML 实验环境与其他项目隔离。

3. 设置 MLflow 跟踪服务器(可选)

直接访问模式(无跟踪服务器)

您可以在不设置跟踪服务器的情况下启动教程并记录模型和实验。在此模式下,您的实验数据和工件将直接保存在您当前的目录下。

虽然此模式是最容易上手的方式,但不建议常规使用。

  • 仅当您从同一目录运行 `mlflow ui` 命令时,UI 才能看到实验数据。
  • 其他团队成员无法访问实验数据。
  • 如果您不小心删除了目录,可能会丢失实验数据。

MLflow 跟踪服务器是一个集中的 HTTP 服务器,允许您访问实验工件,无论您在哪里运行代码。要使用跟踪服务器,您可以本地运行它,也可以使用托管服务。点击以下链接了解每种选项的更多信息。

MLflow 可在各种环境中运行,包括本地环境、本地集群、云平台和托管服务。作为一个开源平台,MLflow 是厂商中立的;无论您在哪里进行机器学习,都可以访问 MLflow 的核心功能集,例如跟踪、评估、可观测性等。

Databricks Logo
Amazon SageMaker Logo
Azure Machine Learning Logo
Nebius Logo
Kubernetes Logo

提示

💡 如果您不是 Databricks 用户,但想免费试用其托管的 MLflow 体验,我们建议使用

Databricks 免费试用。它提供了一个个人 Databricks 账户,并附带在有限时间内有效的服务积分,让您可以在几分钟内开始使用 MLflow 和其他 ML/AI 工具。

4. 将 Notebook 连接到跟踪服务器

注意

如果您在使用 Databricks,则可以跳过此部分,因为 Notebook 已连接到跟踪服务器和 MLflow 实验。

对于其他托管服务(例如 SageMaker、Nebius),请参阅服务提供商提供的文档。

一旦跟踪服务器启动,请通过调用 `mlflow.set_tracking_uri("http://:")` 将您的 Notebook 连接到服务器。例如,如果您在本地的 5000 端口上运行跟踪服务器,您将调用

mlflow.set_tracking_uri("https://:5000")

这将确保所有 MLflow 运行、实验、跟踪和工件都记录到指定的跟踪服务器。

5. 准备运行!

现在您已经设置好了 MLflow 环境,可以开始运行教程了。回到教程,享受学习 MLflow 的旅程吧!🚢