跳到主要内容

MLflow GenAI 入门

自信构建生产级 GenAI 应用

MLflow 改变了您开发、评估和部署 GenAI 应用的方式。从原型到生产,您可以全面了解您的 AI 系统,同时保持使用任何框架或模型提供商的灵活性。

为什么选择 MLflow 用于 GenAI?

🔍 全面可观测性

精确查看您的 AI 应用内部发生了什么。MLflow Tracing 捕获每次 LLM 调用、工具交互和决策点——将黑盒系统转变为透明、可调试的工作流。

📊 自动化质量保证

停止猜测您的更改是否提高了质量。MLflow 的评估框架使用 LLM 判官和自定义指标系统地测试每个迭代,确保持续改进。

🚀 框架自由

使用 LangChain、LlamaIndex、OpenAI 或任何超过 15 个受支持的框架。MLflow 与您现有的工具无缝集成,同时提供一个统一的跟踪和部署平台。

💡 人机协作卓越性

弥合 AI 与领域专业知识之间的鸿沟。收集来自用户和专家的结构化反馈,根据实际使用情况不断完善您的应用。

几分钟内开始构建

按照我们的快速入门指南,体验 MLflow 在 GenAI 开发中的强大功能。每个指南不到 15 分钟,并演示了您每天都会使用的核心功能。

📋 前提条件

开始之前,请确保您已具备

  • Python 3.9 或更高版本
  • 已安装 MLflow 3+ (pip install --upgrade mlflow)
  • 一个 MLflow 跟踪服务器(本地或远程)
MLflow 新手?

从我们的 环境设置快速入门 开始,几分钟内即可上手!

连接您的环境

设置 MLflow 以与您的开发环境协同工作,无论您是使用本地设置、云平台还是托管服务。

您将学到什么

  • 配置 MLflow 跟踪 URI
  • 设置实验跟踪
  • 连接到模型注册表

了解如何连接您的环境 →


使用跟踪收集应用埋点数据

只需几行代码即可为您的 GenAI 应用添加全面的可观测性。实时查看每个提示、检索和工具调用。

您将学到什么

  • 流行框架(例如 OpenAI、LangChain 和 DSPy)的自动埋点
  • 捕获自定义跟踪
  • 调试复杂的 AI 工作流

了解如何在 IDE 中使用跟踪 →

了解如何在 Notebook 中使用跟踪 →


评估应用质量

使用 LLM 判官和自定义指标系统地测试和改进您的应用。从手动测试转向数据驱动的质量保证。

您将学到什么

  • 创建评估数据集
  • 使用 LLM 判官进行质量评估
  • 客观比较模型版本

了解如何评估您的应用 →


实际影响

🎯 更快调试

通过全面了解每个 AI 决策和交互,将调试时间减少 70%。

📈 质量信心

利用在生产前发现退化的自动化评估,放心地进行部署。

🔄 快速迭代

通过集成的实验跟踪和版本控制,将改进速度提高 3 倍。

继续您的旅程

📚 核心概念

🛠️ 框架指南