适用于生成式AI的MLflow运行数据模型
在 MLflow 3 中,运行代表您的生成式AI应用程序的评估迭代,并直接附属于模型,作为模型演进的一部分。与早期 MLflow 版本中运行记录归属于实验不同,运行记录现在捕获特定的评估会话,用于测试和验证模型性能。
概述
一次运行代表了您的生成式AI模型的一次评估迭代——您可以将其视为模型或应用程序在特定测试会话期间表现的快照。
运行记录作为模型演进的快照
每次运行都捕获了模型开发生命周期中的一个特定时刻
与其他实体的关系
运行记录将您的模型开发与系统评估连接起来
主要关系
- 运行可链接到模型:迭代模型或应用程序开发通过运行记录进行跟踪
- 运行生成跟踪记录(Traces):评估执行会创建跟踪记录
- 运行产生评估结果(Assessments):对模型性能的质量判断
- 运行使用数据集(Datasets):针对精选示例进行系统测试
- 运行应用评分器(Scorers):自动化评估功能
模型附带运行记录的优势
MLflow 3 将运行记录附加到模型的方法提供了
- 🎯 以模型为中心的组织:评估历史随模型一同记录
- 📈 演进跟踪:模型性能随时间变化的清晰进展
- 🔍 集中分析:评估结果直接关联到特定的已记录模型
- 🚀 简化工作流:模型开发与测试之间的自然连接
这种以模型为中心的方法使得理解您的生成式AI应用程序如何演进,以及哪些评估迭代带来了改进或退步变得更容易。