MLflow 3.2.0
·5分钟阅读
MLflow 3.2.0 包含多项主要功能和改进
主要新特性
- 🧭 TypeScript SDK 追踪:MLflow Tracing 现在支持 TypeScript SDK,允许开发者在 TypeScript 环境中追踪 GenAI 应用。(#16871, @B-Step62)
- 🔗 Semantic Kernel 追踪:MLflow 现在为 Semantic Kernel 提供自动追踪支持,简化了基于 SK 的工作流的追踪捕获。(#16469, @michael-berk)
- 🧪 反馈跟踪:MLflow OSS 现在原生支持跟踪 人工反馈、地面真相和 LLM 评估,提供集成的质量监控和反馈管理功能。(#16743, @BenWilson2)
- 🖥️ MLflow UI 改进:MLflow UI 现在具有重新设计的实验主页视图,并增加了分页功能,以提高可用性。(#16464, @frontsideair, #15801, @Flametaa)
- 🔍 更新的追踪 UI:现在,Trace UI 在渲染 OpenAI、Langchain 和 Anthropic 的聊天消息时支持图像!此外,我们还引入了一个“摘要视图”,这是对追踪中重要跨度的一种简化、扁平化的表示。完整的详细视图仍在单独的选项卡中提供。
- 🛡️ 追踪中的 PII 屏蔽:增加了通过自定义 span 后处理器屏蔽个人身份信息 (PII) 的支持。(#16344, @B-Step62)
- 🐻❄️ Polars 数据集支持:MLflow 现在支持 Polars 数据集,扩展了与高性能 DataFrame 库的兼容性。(#13006, @AlpAribal)
📊 使用情况跟踪 (3.2.0 新增)
- 从 3.2.0 版本开始,MLflow 将开始收集关于平台核心功能使用情况的匿名使用数据。此数据不包含任何敏感或个人身份信息,用户可以随时选择退出数据收集。请查看 MLflow 文档了解更多详情。(#16439, @serena-ruan)
功能
- [追踪] 将 mlflow-tracing 作为 mlflow 的依赖项包含在内(#16589, @B-Step62)
- [追踪] 将 DatabricksRM 输出转换为 MLflow 文档格式(#16866, @WeichenXu123)
- [追踪] 为 Bedrock LLM 添加统一的 token 使用情况跟踪(#16351, @mohammadsubhani)
- [追踪] 为包括 Anthropic、Autogen、LlamaIndex 等在内的代理框架添加 token 使用情况跟踪(#16251, #16362, #16246, #16258, #16313, #16312, #16340, #16357, #16358, @joelrobin18, #16387, @sanatb187)
- [追踪] 为 LangChain 渲染多模态追踪(#16799, @B-Step62)
- [追踪] 支持 Gemini 的异步追踪(#16632, @B-Step62)
- [追踪] 支持追踪的全局采样(#16700, @B-Step62)
- [追踪] ResponsesAgent 追踪聚合(#16787, @bbqiu)
- [追踪] 添加 Agent 和 LLM 的完整名称(#16613, @joelrobin18)
- [追踪] 通过 mlflow.tracing.set_destination 允许设置线程本地追踪目的地(#16859, @WeichenXu123)
- [追踪] 引入 MLFLOW_DISABLE_SCHEMA_DETAILS 环境变量以切换详细模式错误(#16631, @NJAHNAVI2907)
- [追踪] 为带结构化输出的聊天风格提示添加了对 prompt 对象(#16341, @harshilprajapati96)的支持
- [追踪] 为 oai 自动记录器添加对 responses.parse 调用的支持(#16245, @dipakkrishnan)
- [追踪] 为 mlflow run 添加 uv 作为环境管理器支持(#16274, @isuyyy)
- [评估] 将 guideline_adherence 替换为 guidelines(#16856, @smoorjani)
- [评估] 将 Scheduled Scorers API 替换为 Scorer Registration System(#16977, @dbrx-euirim)
- [UI] 向实验页面添加标签过滤器(#16648, @frontsideair)
- [UI] 允许 UI 编辑实验标签(#16614, @frontsideair)
- [UI] 在实验视图中使用选定的列创建运行表(#16804, @wangh118)
- [评分] 使 spark_udf 支持 'uv' 环境管理器(#16292, @WeichenXu123)
错误修复
- [追踪 / UI] 在新的浏览器客户端请求(GraphQL 和已记录的模型)中添加缺失的默认标头并替换绝对 URL(#16840, @danilopeixoto)
- [追踪] 修复了 artifact 存储库中 tracking_uri 位置参数的 bug(#16878, @copilot-swe-agent)
- [模型] 修复了 Python 3.10 风格联合语法的 UnionType 支持(#16882, @harupy)
- [追踪 / 追踪] 修复了 OpenAI 自动记录 Pydantic 对枚举值的验证(#16862, @mohammadsubhani)
- [追踪] 修复了 Anthropic 和 Langchain 组合的追踪(#15151, @maver1ck)
- [模型] 修复了 OpenAI 多模态消息记录支持(#16795, @mohammadsubhani)
- [追踪] 避免在 Azure Databricks 追踪导出中使用嵌套线程(#16733, @TomeHirata)
- [评估] Bug 修复:Databricks GenAI 评估数据集源返回字符串,而不是 DatasetSource 实例(#16712, @dbczumar)
- [模型] 修复了
get_model_info以提供已记录的模型信息(#16713, @harupy) - [评估] 修复了 Python 评分器的序列化和反序列化(#16688, @connorchenn)
- [UI] 修复了 GraphQL handler 在 NaN 指标值时出错(#16628, @daniellok-db)
- [UI] 恢复视频artifact预览(#16620, @daniellok-db)
- [追踪] 从 OAI 流式响应中正确重建聊天消息(#16519, @B-Step62)
- [追踪] 将 search_traces() 响应中的追踪列转换为 JSON 字符串(#16523, @B-Step62)
- [评估] 修复了 mlflow.evaluate 因 ... 而在 _get_binary_classifier_metrics 中崩溃(#16485, @mohammadsubhani)
- [评估] 修复了
mlflow.genai.evaluate的追踪检测逻辑(#16932, @B-Step62) - [评估] 使 make_genai_metric_from_prompt 可用于 mlflow.evaluate(#16960, @TomeHirata)
- [模型] 为解码流式响应添加了显式编码(#16855, @aravind-segu)
- [追踪] 防止追踪 DSPy 模型 API 密钥(#17021, @czyzby)
- [追踪] 修复了 pytorch 日期时间问题(#17030, @serena-ruan)
- [追踪] 修复了带预发布版本的预测(#16998, @serena-ruan)
文档更新
- [文档] 对顶层版本管理 GenAI 文档进行了全面审查(#16728, @BenWilson2)
- [文档] 修复了额外的 GenAI 文档页面(#16691, @BenWilson2)
- [Docs] 更新文档选择器下拉菜单 (#16280, @BenWilson2)
- [文档] 更新了文档的字体大小和链接颜色(#16281, @BenWilson2)
- [文档] 修复了模型部署页面中的拼写错误(#16999, @premkiran-o7)
如需查看更改的完整列表,请参阅 发布日志,并查阅 mlflow.org 上的最新文档。
