跳到主要内容

您的第一个 MLflow 模型:完整教程

通过构建您的第一个端到端机器学习工作流来掌握 MLflow 的基础知识。本实践教程将带您从设置到部署,涵盖您成功所需的所有基本 MLflow 概念。

您将构建什么

通过本教程,您将创建一个完整的 ML 流水线,该流水线将

  • 🎯 使用您将生成的合成数据集预测苹果质量
  • 📊 使用参数、指标和模型工件跟踪实验
  • 🔍 使用 MLflow UI 比较模型性能
  • 📦 注册您的最佳模型以供生产使用
  • 🚀 部署一个用于实时预测的可用 API
非常适合初学者

🎓 无需 MLflow 经验。我们将通过清晰的解释和实际示例引导您学习每个概念。

⏱️ 在 30-45 分钟内按照自己的节奏完成整个教程,每个步骤都自然地建立在前一个步骤之上。

学习路径

本教程旨在提供渐进式学习体验

阶段 1:设置与基础 (10 分钟)

阶段 2:数据与实验 (15 分钟)

本教程的特别之处

以真实世界为重点

您将使用实际的苹果质量预测问题,而不是玩具示例,这展示了实用的 ML 工作流。

实践学习

每个概念都通过您可以运行和修改的代码示例立即应用。

完整工作流

体验从数据创建到模型部署的完整 ML 生命周期,而不仅仅是孤立的功能。

可视化学习

广泛使用 MLflow UI 有助于您理解跟踪数据在实际中如何显示。

先决条件

  • 系统上安装了 Python 3.8+
  • 基本的 Python 知识(变量、函数、循环)
  • 10 分钟用于初始设置

无需机器学习专业知识——我们将边学边解释 ML 概念!

两种学习方式

在浏览器中按照分步指南操作,包含详细解释和屏幕截图。非常适合深入理解概念。

▶️ 开始交互式教程

Jupyter Notebook

在本地下载并运行完整教程。非常适合实验和自定义。

📓 下载完整笔记本

您将掌握的关键概念

🖥️ MLflow 跟踪服务器 设置并连接到存储所有 ML 实验和工件的中心枢纽。

🔬 实验与运行 将您的 ML 工作组织成逻辑组,并以完整的可重复性跟踪单个训练会话。

📊 指标与参数 记录训练性能、超参数和模型配置,以便于比较和优化。

🤖 模型工件 保存经过训练的模型,并附带适当的版本控制和元数据,以实现一致的部署和共享。

🏷️ 标签与组织 随着项目的增长,使用标签和描述来保持您的实验井然有序且可搜索。

🔍 搜索与发现 使用 MLflow 强大的搜索和过滤功能高效查找和比较实验。

接下来会发生什么

完成本教程后,您将准备好

  • 自信地将 MLflow 应用到您自己的项目中,掌握核心概念
  • 探索高级功能,如超参数调优和 A/B 测试
  • 使用共享跟踪服务器和模型注册表 扩展到团队工作流
  • 使用 MLflow 的服务功能 部署生产模型

准备开始了吗?

选择您喜欢的学习方式并开始吧!本教程旨在一次性完成,但您也可以保存进度并随时返回。

立即开始

交互式教程🚀 开始步骤 1 - 跟踪服务器

笔记本版本:使用上面的下载按钮获取完整的 Jupyter 笔记本


问题或反馈? 本教程根据用户输入不断改进。让我们知道如何使您的学习体验更好!