MLflow 3.2.0
·5分钟阅读
MLflow 3.2.0 包含多项主要功能和改进
主要新特性
- 🧭 追踪 TypeScript SDK:MLflow 追踪现在支持 TypeScript SDK,允许开发人员在 TypeScript 环境中追踪 GenAI 应用程序。(#16871, @B-Step62)
- 🔗 Semantic Kernel 追踪:MLflow 现在为 Semantic Kernel 提供自动追踪支持,简化了基于 SK 的工作流程的追踪捕获。(#16469, @michael-berk)
- 🧪 反馈追踪:MLflow OSS 现在原生支持追踪人工反馈、基准真相以及对追踪的 LLM 评判,提供了集成的质量监控和反馈管理功能。(#16743, @BenWilson2)
- 🖥️ MLflow UI 改进:MLflow UI 现在具有重新设计的实验主页视图,并包括模型页面分页等增强功能,以提高可用性。(#16464, @frontsideair, #15801, @Flametaa)
- 🔍 更新的追踪 UI:追踪 UI 现在在渲染 OpenAI、Langchain 和 Anthropic 的聊天消息时支持图像!此外,我们还引入了“摘要视图”,它是追踪中重要跨度的简化、扁平化表示。完整的详细视图仍然在单独的选项卡中提供。
- 🛡️ 追踪中的 PII 屏蔽:增加了对通过自定义跨度后处理器屏蔽个人身份信息 (PII) 的支持。(#16344, @B-Step62)
- 🐻❄️ Polars 数据集支持:MLflow 现在支持 Polars 数据集,扩展了与高性能 DataFrame 库的兼容性。(#13006, @AlpAribal)
📊 使用情况跟踪 (3.2.0 新增)
- 从 3.2.0 版本开始,MLflow 将开始收集关于平台核心功能使用方式的匿名使用数据。这些数据不包含任何敏感或个人身份信息,用户可以随时选择退出数据收集。请查看 MLflow 文档了解更多详情。(#16439, @serena-ruan)
功能
- [追踪] 将 mlflow-tracing 作为 mlflow 的依赖项包含 (#16589, @B-Step62)
- [追踪] 将 DatabricksRM 输出转换为 MLflow 文档格式 (#16866, @WeichenXu123)
- [追踪] 为 Bedrock LLM 添加统一的令牌使用情况跟踪 (#16351, @mohammadsubhani)
- [追踪] 为包括 Anthropic、Autogen、LlamaIndex 等代理框架提供令牌使用情况跟踪 (#16251, #16362, #16246, #16258, #16313, #16312, #16340, #16357, #16358, @joelrobin18, #16387, @sanatb187)
- [追踪] 为 LangChain 渲染多模态追踪 (#16799, @B-Step62)
- [追踪] 支持 Gemini 的异步追踪 (#16632, @B-Step62)
- [追踪] 支持追踪的全局采样 (#16700, @B-Step62)
- [追踪] ResponsesAgent 追踪聚合 (#16787, @bbqiu)
- [追踪] 添加代理和 LLM 的完整名称 (#16613, @joelrobin18)
- [跟踪] 允许通过 mlflow.tracing.set_destination 设置线程本地追踪目的地 (#16859, @WeichenXu123)
- [跟踪] 引入 MLFLOW_DISABLE_SCHEMA_DETAILS 环境变量以切换详细的模式错误 (#16631, @NJAHNAVI2907)
- [跟踪] 添加对带有结构化输出的聊天式提示的支持,使用提示对象 (#16341, @harshilprajapati96)
- [跟踪] 在 oai 自动记录器中添加对 responses.parse 调用的支持 (#16245, @dipakkrishnan)
- [跟踪] 在 mlflow run 中添加对 uv 作为环境管理器的支持 (#16274, @isuyyy)
- [评估] 将 guideline_adherence 替换为 guidelines (#16856, @smoorjani)
- [评估] 将计划评分器 API 替换为评分器注册系统 (#16977, @dbrx-euirim)
- [UI] 在实验页面添加标签过滤器 (#16648, @frontsideair)
- [UI] 在 UI 中添加编辑实验标签的功能 (#16614, @frontsideair)
- [UI] 在实验视图中使用选定的列创建运行表 (#16804, @wangh118)
- [评分] 使 spark_udf 支持 'uv' 环境管理器 (#16292, @WeichenXu123)
错误修复
- [跟踪 / UI] 在新的浏览器客户端请求(GraphQL & 记录的模型)中添加缺失的默认标头并替换绝对 URL (#16840, @danilopeixoto)
- [跟踪] 修复工件存储库中的 tracking_uri 位置参数错误 (#16878, @copilot-swe-agent)
- [模型] 修复对 Python 3.10 风格联合语法的 UnionType 支持 (#16882, @harupy)
- [追踪 / 跟踪] 修复 OpenAI 自动记录器对枚举值的 Pydantic 验证 (#16862, @mohammadsubhani)
- [跟踪] 修复 Anthropic 和 Langchain 组合的追踪 (#15151, @maver1ck)
- [模型] 修复 OpenAI 多模态消息记录支持 (#16795, @mohammadsubhani)
- [追踪] 避免对 Azure Databricks 追踪导出使用嵌套线程 (#16733, @TomeHirata)
- [评估] 错误修复:Databricks GenAI 评估数据集源返回字符串,而不是 DatasetSource 实例 (#16712, @dbczumar)
- [模型] 修复
get_model_info
以提供记录的模型信息 (#16713, @harupy) - [评估] 修复 python 评分器的序列化和反序列化 (#16688, @connorchenn)
- [UI] 修复 GraphQL 处理程序在 NaN 指标值上出错的问题 (#16628, @daniellok-db)
- [UI] 重新添加视频工件预览 (#16620, @daniellok-db)
- [追踪] 从 OAI 流式响应中正确重建聊天消息 (#16519, @B-Step62)
- [追踪] 将 search_traces() 响应中的 trace 列转换为 JSON 字符串 (#16523, @B-Step62)
- [评估] 修复 mlflow.evaluate 因 _get_binary_classifier_metrics 中的 ... 导致的崩溃 (#16485, @mohammadsubhani)
- [评估] 修复
mlflow.genai.evaluate
的追踪检测逻辑 (#16932, @B-Step62) - [评估] 启用 make_genai_metric_from_prompt 用于 mlflow.evaluate (#16960, @TomeHirata)
- [模型] 为解码流式响应添加显式编码 (#16855, @aravind-segu)
- [跟踪] 防止追踪 DSPy 模型 API 密钥 (#17021, @czyzby)
- [跟踪] 修复 pytorch 日期时间问题 (#17030, @serena-ruan)
- [跟踪] 修复使用预发布版本的预测 (#16998, @serena-ruan)
文档更新
- [文档] 全面修订顶层版本管理的 GenAI 文档 (#16728, @BenWilson2)
- [文档] 修复额外的 GenAI 文档页面 (#16691, @BenWilson2)
- [文档] 更新文档选择器下拉菜单 (#16280, @BenWilson2)
- [文档] 更新文档字体大小和链接颜色 (#16281, @BenWilson2)
- [文档] 修复模型部署页面中的拼写错误 (#16999, @premkiran-o7)
有关完整的变更列表,请参阅 发布变更日志,并查看 mlflow.org 上的最新文档。