如何运行教程
本简短指南将引导您了解运行这些教程的一些选项,以及如何设置一个可用于记录结果的跟踪服务器(并提供 MLflow UI 的选项)。
1. 下载 Notebook
您可以通过点击每个教程页面顶部的“下载 Notebook”按钮来下载教程 Notebook。
2. 安装 MLflow
通过运行以下命令从 PyPI 安装 MLflow
pip install mlflow
3. 设置 MLflow 跟踪服务器(可选)
直接访问模式(无跟踪服务器)
您可以启动教程并记录模型、实验,而无需设置跟踪服务器。在此模式下,您的实验数据和工件将直接保存在您当前目录下。
虽然此模式是最简单的入门方式,但通常不建议使用
- 只有当您从同一目录运行
mlflow ui
命令时,实验数据才会在 UI 上可见。 - 其他团队成员无法访问实验数据。
- 如果您不小心删除了目录,您的实验数据可能会丢失。
运行跟踪服务器(推荐)
MLflow 跟踪服务器是一个集中的 HTTP 服务器,它允许您无论代码在哪里运行,都能访问您的实验工件。要使用跟踪服务器,您可以选择在本地运行它或使用托管服务。点击以下链接了解更多关于每个选项的信息
MLflow 可以在各种环境中运行,包括您的本地环境、本地集群、云平台和托管服务。作为一个开源平台,MLflow 是与供应商无关的;无论您在哪里进行机器学习,您都可以访问 MLflow 的核心功能集,例如跟踪、评估、可观察性等。
💡 如果您不是 Databricks 用户,但想免费试用其托管的 MLflow 体验,我们建议您使用
Databricks 免费试用。它提供一个带有服务积分的个人 Databricks 账户,该积分在有限时间内有效,让您在几分钟内开始使用 MLflow 和其他 ML/AI 工具。
4. 将 Notebook 连接到跟踪服务器
如果您使用的是 Databricks,则可以跳过此部分,因为 Notebook 已连接到跟踪服务器和 MLflow 实验。
对于其他托管服务(例如 SageMaker、Nebius),请参考服务提供商提供的文档。
跟踪服务器启动后,通过调用 mlflow.set_tracking_uri("http://<your-mlflow-server>:<port>")
将您的 Notebook 连接到服务器。例如,如果您在本地端口 5000 上运行跟踪服务器,您将调用
mlflow.set_tracking_uri("https://:5000")
这将确保所有 MLflow 运行、实验、跟踪和工件都记录到指定的跟踪服务器。
5. 准备运行!
现在您已经设置好 MLflow 环境,可以运行教程了。回到教程页面,享受学习 MLflow 的旅程吧!🚢