您的第一个 MLflow 模型:完整教程
通过构建您的第一个端到端机器学习工作流,掌握 MLflow 的基础知识。本实践教程将引导您从设置到部署,涵盖您成功所需的所有 MLflow 基本概念。
您将构建什么
在本教程结束时,您将创建一个完整的机器学习管道,该管道将
- 🎯 预测苹果质量,使用您将生成的合成数据集
- 📊 跟踪实验,包含参数、指标和模型工件
- 🔍 比较模型性能,使用 MLflow UI
- 📦 注册您的最佳模型,用于生产环境
- 🚀 部署可工作的 API,用于实时预测
🎓 无需任何 MLflow 经验。我们将通过清晰的解释和实际示例引导您掌握每个概念。
⏱️ 您可以在 30-45 分钟内按照自己的节奏完成整个教程,每个步骤都自然地建立在前一个步骤的基础上。
学习路径
本教程旨在提供渐进式学习体验
阶段 1:设置与基础(10 分钟)
- 🖥️ 启动您的 MLflow 跟踪服务器 - 让您的本地环境运行起来
- 🔌 掌握 MLflow 客户端 API - 学习编程接口
- 📁 了解 MLflow 实验 - 组织您的机器学习工作
阶段 2:数据与实验(15 分钟)
- 🔍 搜索和筛选实验 - 高效管理您的工作
- 🍎 生成您的苹果数据集 - 创建真实的训练数据
- 📈 记录您的第一次 ML 运行 - 跟踪参数、指标和模型
本教程的独特之处
聚焦真实世界
您将不再使用玩具示例,而是处理一个实际的苹果质量预测问题,该问题展示了实用的机器学习工作流。
动手实践学习
每个概念都通过您可以运行和修改的代码示例立即应用。
完整工作流
体验从数据创建到模型部署的完整机器学习生命周期,而不仅仅是孤立的功能。
可视化学习
广泛使用 MLflow UI 有助于您了解跟踪数据在实践中如何呈现。
先决条件
- 您的系统已安装 Python 3.8+
- 基础 Python 知识(变量、函数、循环)
- 初始设置需要 10 分钟
无需机器学习专业知识——我们将在教程中逐步解释机器学习概念!
两种学习方式
交互式网页教程(推荐)
在浏览器中按照分步指南学习,其中包含详细的解释和截图。非常适合深入理解概念。
Jupyter 笔记本
在本地下载并运行完整教程。非常适合实验和自定义。
📓 下载完整笔记本您将掌握的关键概念
🖥️ MLflow 跟踪服务器 设置并连接到存储所有机器学习实验和工件的中央枢纽。
🔬 实验与运行 将您的机器学习工作组织成逻辑组,并以完全可复现的方式跟踪单个训练会话。
📊 指标与参数 记录训练性能、超参数和模型配置,以便于比较和优化。
🤖 模型工件 使用适当的版本控制和元数据保存训练好的模型,以实现一致的部署和共享。
🏷️ 标签与组织 使用标签和描述来组织和搜索您的实验,随着项目的增长保持条理清晰。
🔍 搜索与发现 利用 MLflow 强大的搜索和筛选功能高效查找和比较实验。
接下来会发生什么
完成本教程后,您将能够
- 将 MLflow 应用到您自己的项目,对核心概念充满信心
- 探索高级功能,如超参数调优和 A/B 测试
- 扩展到团队工作流,使用共享跟踪服务器和模型注册表
- 部署生产模型,使用 MLflow 的服务功能
准备开始了吗?
选择您喜欢的学习方式并开始吧!本教程旨在一次性完成,但您也可以保存进度并随时返回。
交互式教程: 🚀 启动步骤 1 - 跟踪服务器
笔记本版本: 使用上方下载按钮获取完整的 Jupyter 笔记本
有问题或反馈? 本教程会根据用户反馈持续改进。请告诉我们如何让您的学习体验变得更好!