跳到主要内容

您的第一个 MLflow 模型:完整教程

通过构建您的第一个端到端机器学习工作流,掌握 MLflow 的基础知识。本实践教程将引导您从设置到部署,涵盖您成功所需的所有 MLflow 基本概念。

您将构建什么

在本教程结束时,您将创建一个完整的机器学习管道,该管道将

  • 🎯 预测苹果质量,使用您将生成的合成数据集
  • 📊 跟踪实验,包含参数、指标和模型工件
  • 🔍 比较模型性能,使用 MLflow UI
  • 📦 注册您的最佳模型,用于生产环境
  • 🚀 部署可工作的 API,用于实时预测
非常适合初学者

🎓 无需任何 MLflow 经验。我们将通过清晰的解释和实际示例引导您掌握每个概念。

⏱️ 您可以在 30-45 分钟内按照自己的节奏完成整个教程,每个步骤都自然地建立在前一个步骤的基础上。

学习路径

本教程旨在提供渐进式学习体验

阶段 1:设置与基础(10 分钟)

阶段 2:数据与实验(15 分钟)

本教程的独特之处

聚焦真实世界

您将不再使用玩具示例,而是处理一个实际的苹果质量预测问题,该问题展示了实用的机器学习工作流。

动手实践学习

每个概念都通过您可以运行和修改的代码示例立即应用。

完整工作流

体验从数据创建到模型部署的完整机器学习生命周期,而不仅仅是孤立的功能。

可视化学习

广泛使用 MLflow UI 有助于您了解跟踪数据在实践中如何呈现。

先决条件

  • 您的系统已安装 Python 3.8+
  • 基础 Python 知识(变量、函数、循环)
  • 初始设置需要 10 分钟

无需机器学习专业知识——我们将在教程中逐步解释机器学习概念!

两种学习方式

在浏览器中按照分步指南学习,其中包含详细的解释和截图。非常适合深入理解概念。

▶️ 启动交互式教程

Jupyter 笔记本

在本地下载并运行完整教程。非常适合实验和自定义。

📓 下载完整笔记本

您将掌握的关键概念

🖥️ MLflow 跟踪服务器 设置并连接到存储所有机器学习实验和工件的中央枢纽。

🔬 实验与运行 将您的机器学习工作组织成逻辑组,并以完全可复现的方式跟踪单个训练会话。

📊 指标与参数 记录训练性能、超参数和模型配置,以便于比较和优化。

🤖 模型工件 使用适当的版本控制和元数据保存训练好的模型,以实现一致的部署和共享。

🏷️ 标签与组织 使用标签和描述来组织和搜索您的实验,随着项目的增长保持条理清晰。

🔍 搜索与发现 利用 MLflow 强大的搜索和筛选功能高效查找和比较实验。

接下来会发生什么

完成本教程后,您将能够

  • 将 MLflow 应用到您自己的项目,对核心概念充满信心
  • 探索高级功能,如超参数调优和 A/B 测试
  • 扩展到团队工作流,使用共享跟踪服务器和模型注册表
  • 部署生产模型,使用 MLflow 的服务功能

准备开始了吗?

选择您喜欢的学习方式并开始吧!本教程旨在一次性完成,但您也可以保存进度并随时返回。

立即开始

交互式教程: 🚀 启动步骤 1 - 跟踪服务器

笔记本版本: 使用上方下载按钮获取完整的 Jupyter 笔记本


有问题或反馈? 本教程会根据用户反馈持续改进。请告诉我们如何让您的学习体验变得更好!