您的第一个 MLflow 模型:完整教程
通过构建您的第一个端到端机器学习工作流来掌握 MLflow 的基本知识。本实践教程将带您从设置到部署,涵盖您成功所需的所有基本 MLflow 概念。
您将构建什么
在本教程结束时,您将创建一个完整的 ML 流水线,该流水线将:
- 🎯 使用您将生成的合成数据集**预测苹果质量**
- 📊 使用参数、指标和模型工件**跟踪实验**
- 🔍 使用 MLflow UI **比较模型性能**
- 📦 **注册您的最佳模型**以供生产使用
- 🚀 **部署一个可工作的 API**以进行实时预测
🎓 无需 MLflow 经验。我们将通过清晰的解释和实际示例指导您完成每个概念。
⏱️ 以您自己的节奏在 30-45 分钟内完成完整教程,每个步骤都以前一个步骤为基础,自然衔接。
学习路径
本教程设计为循序渐进的学习体验
第一阶段:设置与基础(10 分钟)
- 🖥️ 启动您的 MLflow 跟踪服务器 - 让您的本地环境运行起来
- 🔌 掌握 MLflow 客户端 API - 学习编程接口
- 📁 理解 MLflow 实验 - 组织您的 ML 工作
第二阶段:数据与实验(15 分钟)
- 🔍 搜索和过滤实验 - 高效地浏览您的工作
- 🍎 生成您的苹果数据集 - 创建逼真的训练数据
- 📈 记录您的第一个 ML 运行 - 跟踪参数、指标和模型
是什么让本教程与众不同
以现实世界为重点
您将处理一个真实的苹果质量预测问题,而不是玩具示例,该问题展示了实际的 ML 工作流。
动手学习
每个概念都通过您可以运行和修改的代码示例立即得到应用。
完整的工作流
体验从数据创建到模型部署的完整 ML 生命周期,而不仅仅是孤立的功能。
可视化学习
大量使用 MLflow UI 帮助您了解跟踪数据在实践中是如何显示的。
先决条件
- 您的系统上安装了Python 3.8+
- 基本 Python 知识(变量、函数、循环)
- 10 分钟进行初始设置
不需要机器学习专业知识 - 我们将在过程中解释 ML 概念!
两种学习方式
交互式 Web 教程(推荐)
在浏览器中按照分步指南进行操作,其中包含详细的解释和屏幕截图。非常适合深入理解概念。
Jupyter Notebook
下载并在本地运行完整的教程。非常适合实验和自定义。
📓 下载完整 Notebook您将掌握的关键概念
🖥️ MLflow 跟踪服务器 设置并连接到存储所有 ML 实验和工件的中心枢纽。
🔬 实验与运行 将您的 ML 工作组织成逻辑组,并通过完整的可重现性跟踪单个训练会话。
📊 指标与参数 记录训练性能、超参数和模型配置,以便轻松比较和优化。
🤖 模型工件 以正确的版本和元数据保存训练模型,以实现一致的部署和共享。
🏷️ 标签与组织 使用标签和描述来保持实验的组织性和可搜索性,随着项目的发展。
🔍 搜索与发现 使用 MLflow 强大的搜索和过滤功能高效地查找和比较实验。
接下来会发生什么
完成本教程后,您将能够
- 自信地将 MLflow 应用于您自己的项目,掌握核心概念
- 探索高级功能,如超参数调优和 A/B 测试
- 通过共享跟踪服务器和模型注册表扩展到团队工作流
- 使用 MLflow 的服务功能部署生产模型
准备开始了吗?
选择您偏好的学习方式,立即开始!本教程设计为一次性完成,但您也可以为您的进度添加书签并随时返回。
交互式教程:🚀 开始第一步 - 跟踪服务器
Notebook 版本:使用上面的下载按钮获取完整的 Jupyter notebook
有问题或反馈? 本教程根据用户输入不断改进。请告诉我们如何让您的学习体验更好!