MLflow 3.2.0
MLflow 3.2.0 包含多项主要功能和改进
主要新特性
- 🧭 追踪 TypeScript SDK:MLflow 追踪现在支持 TypeScript SDK,允许开发者在 TypeScript 环境中追踪 GenAI 应用程序。(#16871,@B-Step62)
- 🔗 语义内核追踪:MLflow 现在提供 对语义内核的自动追踪支持,简化了基于 SK 的工作流的追踪捕获。(#16469,@michael-berk)
- 🧪 反馈跟踪:MLflow OSS 现在原生支持跟踪人工反馈、真实值、追踪上的 LLM 裁判,提供集成质量监控和反馈管理功能。(#16743,@BenWilson2)
- 🖥️ MLflow UI 改进:MLflow UI 现在具有重新设计的实验主视图,并包括模型页面上的分页等增强功能,以提高可用性。(#16464,@frontsideair,#15801,@Flametaa)
- 🔍 更新的追踪 UI:追踪 UI 现在支持在渲染 OpenAI、Langchain 和 Anthropic 的聊天消息时显示图像!此外,我们引入了“摘要视图”,它是追踪中重要跨度的简化平面表示。完整详细视图仍可在单独的选项卡中查看。
- 🛡️ 追踪中的 PII 掩码:增加了通过自定义跨度后处理器掩码个人身份信息 (PII) 的支持。(#16344,@B-Step62)
- 🐻❄️ 极性数据集支持:MLflow 现在支持 极性数据集,扩展了与高性能 DataFrame 库的兼容性。(#13006,@AlpAribal)
📊 使用情况跟踪 (3.2.0 新增)
- 从 3.2.0 版本开始,MLflow 将开始收集关于平台核心功能如何使用的匿名使用数据。这些数据不包含任何敏感或个人身份信息,用户可以随时选择退出数据收集。有关更多详细信息,请查看 MLflow 文档。(#16439,@serena-ruan)
功能
- [追踪] 将 mlflow-tracing 作为 mlflow 的依赖项包含在内 (#16589, @B-Step62)
- [追踪] 将 DatabricksRM 输出转换为 MLflow 文档格式 (#16866, @WeichenXu123)
- [追踪] 为 Bedrock LLM 添加统一的令牌使用跟踪 (#16351, @mohammadsubhani)
- [追踪] 代理框架的令牌使用跟踪,包括 Anthropic、Autogen、LlamaIndex 等。(#16251,#16362,#16246,#16258,#16313,#16312,#16340,#16357,#16358,@joelrobin18,#16387,@sanatb187)
- [追踪] 为 LangChain 渲染多模态追踪 (#16799, @B-Step62)
- [追踪] 支持 Gemini 异步追踪 (#16632, @B-Step62)
- [追踪] 支持全局采样进行追踪 (#16700, @B-Step62)
- [追踪] ResponsesAgent 追踪聚合 (#16787, @bbqiu)
- [追踪] 添加代理和 LLM 完整名称 (#16613, @joelrobin18)
- [跟踪] 允许通过 mlflow.tracing.set_destination 设置线程本地跟踪目标 (#16859, @WeichenXu123)
- [追踪] 引入 MLFLOW_DISABLE_SCHEMA_DETAILS 环境变量以切换详细的模式错误 (#16631, @NJAHNAVI2907)
- [追踪] 添加支持通过提示对象进行结构化输出的聊天式提示 (#16341, @harshilprajapati96)
- [追踪] 为 oai 自动记录器中的 responses.parse 调用添加支持 (#16245, @dipakkrishnan)
- [追踪] 在 mlflow 运行中添加对 uv 作为环境管理器的支持 (#16274, @isuyyy)
- [评估] 将 guideline_adherence 替换为 guidelines (#16856, @smoorjani)
- [评估] 将计划的评分器 API 替换为评分器注册系统 (#16977, @dbrx-euirim)
- [UI] 在实验页面添加标签过滤器 (#16648, @frontsideair)
- [UI] 增加在 UI 中编辑实验标签的功能 (#16614, @frontsideair)
- [UI] 使用实验视图中选定的列创建运行表 (#16804, @wangh118)
- [评分] 使 spark_udf 支持 'uv' 环境管理器 (#16292, @WeichenXu123)
错误修复
- [追踪 / UI] 在新的浏览器客户端请求 (GraphQL 和已记录的模型) 中添加缺失的默认头部并替换绝对 URL (#16840, @danilopeixoto)
- [追踪] 修复 artifact 存储库中 tracking_uri 位置参数的错误 (#16878, @copilot-swe-agent)
- [模型] 修复 Python 3.10 样式联合语法对 UnionType 的支持 (#16882, @harupy)
- [追踪/跟踪] 修复 OpenAI 自动日志 Pydantic 枚举值验证 (#16862, @mohammadsubhani)
- [追踪] 修复 Anthropic 和 Langchain 组合的追踪问题 (#15151, @maver1ck)
- [模型] 修复 OpenAI 多模态消息日志支持 (#16795, @mohammadsubhani)
- [追踪] 避免在 Azure Databricks 追踪导出时使用嵌套线程 (#16733, @TomeHirata)
- [评估] 错误修复:Databricks GenAI 评估数据集源返回字符串,而不是 DatasetSource 实例 (#16712, @dbczumar)
- [模型] 修复
get_model_info
以提供已记录的模型信息 (#16713, @harupy) - [评估] 修复 python 评分器的序列化和反序列化问题 (#16688, @connorchenn)
- [UI] 修复 GraphQL 处理程序在 NaN 指标值上出错的问题 (#16628, @daniellok-db)
- [UI] 重新添加视频工件预览 (#16620, @daniellok-db)
- [追踪] 从 OAI 流式响应正确重建聊天消息 (#16519, @B-Step62)
- [追踪] 将 search_traces() 响应中的追踪列转换为 JSON 字符串 (#16523, @B-Step62)
- [评估] 修复 mlflow.evaluate 在 _get_binary_classifier_metrics 中由于 ... 崩溃的问题 (#16485, @mohammadsubhani)
- [评估] 修复
mlflow.genai.evaluate
的追踪检测逻辑 (#16932, @B-Step62) - [评估] 使 make_genai_metric_from_prompt 能够用于 mlflow.evaluate (#16960, @TomeHirata)
- [模型] 添加用于解码流式响应的显式编码 (#16855, @aravind-segu)
- [追踪] 防止追踪 DSPy 模型 API 密钥 (#17021, @czyzby)
- [追踪] 修复 pytorch 日期时间问题 (#17030, @serena-ruan)
- [跟踪] 修复预发布版本预测问题 (#16998, @serena-ruan)
文档更新
- [文档] 全面修订顶层版本管理 GenAI 文档 (#16728, @BenWilson2)
- [文档] 修复附加 GenAI 文档页面 (#16691, @BenWilson2)
- [文档] 更新文档选择器下拉菜单 (#16280, @BenWilson2)
- [文档] 更新文档字体大小和链接颜色 (#16281, @BenWilson2)
- [文档] 修复模型部署页面中的拼写错误 (#16999, @premkiran-o7)
有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。