跳到主要内容

适用于生成式AI的MLflow运行数据模型

在 MLflow 3 中,运行代表您的生成式AI应用程序的评估迭代,并直接附属于模型,作为模型演进的一部分。与早期 MLflow 版本中运行记录归属于实验不同,运行记录现在捕获特定的评估会话,用于测试和验证模型性能。

概述

一次运行代表了您的生成式AI模型的一次评估迭代——您可以将其视为模型或应用程序在特定测试会话期间表现的快照。

运行记录作为模型演进的快照

每次运行都捕获了模型开发生命周期中的一个特定时刻

与其他实体的关系

运行记录将您的模型开发与系统评估连接起来

主要关系

  • 运行可链接到模型:迭代模型或应用程序开发通过运行记录进行跟踪
  • 运行生成跟踪记录(Traces):评估执行会创建跟踪记录
  • 运行产生评估结果(Assessments):对模型性能的质量判断
  • 运行使用数据集(Datasets):针对精选示例进行系统测试
  • 运行应用评分器(Scorers):自动化评估功能

模型附带运行记录的优势

MLflow 3 将运行记录附加到模型的方法提供了

  • 🎯 以模型为中心的组织:评估历史随模型一同记录
  • 📈 演进跟踪:模型性能随时间变化的清晰进展
  • 🔍 集中分析:评估结果直接关联到特定的已记录模型
  • 🚀 简化工作流:模型开发与测试之间的自然连接

这种以模型为中心的方法使得理解您的生成式AI应用程序如何演进,以及哪些评估迭代带来了改进或退步变得更容易。