您的第一个 MLflow 模型:完整教程
通过构建您的第一个端到端机器学习工作流来掌握 MLflow 的基础知识。本实践教程将带您从设置到部署,涵盖您成功所需的所有基本 MLflow 概念。
您将构建什么
通过本教程,您将创建一个完整的 ML 流水线,该流水线将
- 🎯 使用您将生成的合成数据集预测苹果质量
- 📊 使用参数、指标和模型工件跟踪实验
- 🔍 使用 MLflow UI 比较模型性能
- 📦 注册您的最佳模型以供生产使用
- 🚀 部署一个用于实时预测的可用 API
🎓 无需 MLflow 经验。我们将通过清晰的解释和实际示例引导您学习每个概念。
⏱️ 在 30-45 分钟内按照自己的节奏完成整个教程,每个步骤都自然地建立在前一个步骤之上。
学习路径
本教程旨在提供渐进式学习体验
阶段 1:设置与基础 (10 分钟)
- 🖥️ 启动您的 MLflow 跟踪服务器 - 运行您的本地环境
- 🔌 掌握 MLflow 客户端 API - 学习编程接口
- 📁 理解 MLflow 实验 - 组织您的 ML 工作
阶段 2:数据与实验 (15 分钟)
- 🔍 搜索和过滤实验 - 高效导航您的工作
- 🍎 生成您的苹果数据集 - 创建真实的训练数据
- 📈 记录您的第一个 ML 运行 - 跟踪参数、指标和模型
本教程的特别之处
以真实世界为重点
您将使用实际的苹果质量预测问题,而不是玩具示例,这展示了实用的 ML 工作流。
实践学习
每个概念都通过您可以运行和修改的代码示例立即应用。
完整工作流
体验从数据创建到模型部署的完整 ML 生命周期,而不仅仅是孤立的功能。
可视化学习
广泛使用 MLflow UI 有助于您理解跟踪数据在实际中如何显示。
先决条件
- 系统上安装了 Python 3.8+
- 基本的 Python 知识(变量、函数、循环)
- 10 分钟用于初始设置
无需机器学习专业知识——我们将边学边解释 ML 概念!
两种学习方式
交互式网页教程(推荐)
在浏览器中按照分步指南操作,包含详细解释和屏幕截图。非常适合深入理解概念。
Jupyter Notebook
在本地下载并运行完整教程。非常适合实验和自定义。
📓 下载完整笔记本您将掌握的关键概念
🖥️ MLflow 跟踪服务器 设置并连接到存储所有 ML 实验和工件的中心枢纽。
🔬 实验与运行 将您的 ML 工作组织成逻辑组,并以完整的可重复性跟踪单个训练会话。
📊 指标与参数 记录训练性能、超参数和模型配置,以便于比较和优化。
🤖 模型工件 保存经过训练的模型,并附带适当的版本控制和元数据,以实现一致的部署和共享。
🏷️ 标签与组织 随着项目的增长,使用标签和描述来保持您的实验井然有序且可搜索。
🔍 搜索与发现 使用 MLflow 强大的搜索和过滤功能高效查找和比较实验。
接下来会发生什么
完成本教程后,您将准备好
- 自信地将 MLflow 应用到您自己的项目中,掌握核心概念
- 探索高级功能,如超参数调优和 A/B 测试
- 使用共享跟踪服务器和模型注册表 扩展到团队工作流
- 使用 MLflow 的服务功能 部署生产模型
准备开始了吗?
选择您喜欢的学习方式并开始吧!本教程旨在一次性完成,但您也可以保存进度并随时返回。
交互式教程:🚀 开始步骤 1 - 跟踪服务器
笔记本版本:使用上面的下载按钮获取完整的 Jupyter 笔记本
问题或反馈? 本教程根据用户输入不断改进。让我们知道如何使您的学习体验更好!