跳到主要内容

MLflow 3.2.0

·5分钟阅读
MLflow maintainers
MLflow 维护者

MLflow 3.2.0 包含多项主要功能和改进

主要新特性

  • 🧭 追踪 TypeScript SDK:MLflow 追踪现在支持 TypeScript SDK,允许开发者在 TypeScript 环境中追踪 GenAI 应用程序。(#16871@B-Step62
  • 🔗 语义内核追踪:MLflow 现在提供 对语义内核的自动追踪支持,简化了基于 SK 的工作流的追踪捕获。(#16469@michael-berk
  • 🧪 反馈跟踪:MLflow OSS 现在原生支持跟踪人工反馈真实值、追踪上的 LLM 裁判,提供集成质量监控和反馈管理功能。(#16743@BenWilson2
  • 🖥️ MLflow UI 改进:MLflow UI 现在具有重新设计的实验主视图,并包括模型页面上的分页等增强功能,以提高可用性。(#16464@frontsideair#15801@Flametaa
  • 🔍 更新的追踪 UI:追踪 UI 现在支持在渲染 OpenAI、Langchain 和 Anthropic 的聊天消息时显示图像!此外,我们引入了“摘要视图”,它是追踪中重要跨度的简化平面表示。完整详细视图仍可在单独的选项卡中查看。
  • 🛡️ 追踪中的 PII 掩码:增加了通过自定义跨度后处理器掩码个人身份信息 (PII) 的支持。(#16344@B-Step62
  • 🐻‍❄️ 极性数据集支持:MLflow 现在支持 极性数据集,扩展了与高性能 DataFrame 库的兼容性。(#13006@AlpAribal

📊 使用情况跟踪 (3.2.0 新增)

  • 从 3.2.0 版本开始,MLflow 将开始收集关于平台核心功能如何使用的匿名使用数据。这些数据不包含任何敏感或个人身份信息,用户可以随时选择退出数据收集。有关更多详细信息,请查看 MLflow 文档。(#16439@serena-ruan

功能

错误修复

  • [追踪 / UI] 在新的浏览器客户端请求 (GraphQL 和已记录的模型) 中添加缺失的默认头部并替换绝对 URL (#16840, @danilopeixoto)
  • [追踪] 修复 artifact 存储库中 tracking_uri 位置参数的错误 (#16878, @copilot-swe-agent)
  • [模型] 修复 Python 3.10 样式联合语法对 UnionType 的支持 (#16882, @harupy)
  • [追踪/跟踪] 修复 OpenAI 自动日志 Pydantic 枚举值验证 (#16862, @mohammadsubhani)
  • [追踪] 修复 Anthropic 和 Langchain 组合的追踪问题 (#15151, @maver1ck)
  • [模型] 修复 OpenAI 多模态消息日志支持 (#16795, @mohammadsubhani)
  • [追踪] 避免在 Azure Databricks 追踪导出时使用嵌套线程 (#16733, @TomeHirata)
  • [评估] 错误修复:Databricks GenAI 评估数据集源返回字符串,而不是 DatasetSource 实例 (#16712, @dbczumar)
  • [模型] 修复 get_model_info 以提供已记录的模型信息 (#16713, @harupy)
  • [评估] 修复 python 评分器的序列化和反序列化问题 (#16688, @connorchenn)
  • [UI] 修复 GraphQL 处理程序在 NaN 指标值上出错的问题 (#16628, @daniellok-db)
  • [UI] 重新添加视频工件预览 (#16620, @daniellok-db)
  • [追踪] 从 OAI 流式响应正确重建聊天消息 (#16519, @B-Step62)
  • [追踪] 将 search_traces() 响应中的追踪列转换为 JSON 字符串 (#16523, @B-Step62)
  • [评估] 修复 mlflow.evaluate 在 _get_binary_classifier_metrics 中由于 ... 崩溃的问题 (#16485, @mohammadsubhani)
  • [评估] 修复 mlflow.genai.evaluate 的追踪检测逻辑 (#16932, @B-Step62)
  • [评估] 使 make_genai_metric_from_prompt 能够用于 mlflow.evaluate (#16960, @TomeHirata)
  • [模型] 添加用于解码流式响应的显式编码 (#16855, @aravind-segu)
  • [追踪] 防止追踪 DSPy 模型 API 密钥 (#17021, @czyzby)
  • [追踪] 修复 pytorch 日期时间问题 (#17030, @serena-ruan)
  • [跟踪] 修复预发布版本预测问题 (#16998, @serena-ruan)

文档更新

有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。

MLflow 3.1.1

·阅读一分钟
MLflow maintainers
MLflow 维护者

MLflow 3.1.1 包含多项主要功能和改进

功能

  • [模型注册表 / Sqlalchemy] 将提示文本限制从 5K 增加到 100K (#16377, @harupy)
  • [追踪] 在 FileStore 和 SqlAlchemyStore 的 get-history 中支持分页 (#16325, @TomeHirata)

错误修复

  • [工件] 支持下载已记录的模型工件 (#16356, @TomeHirata)
  • [模型] 修复 bedrock 提供商、配置的推理配置文件兼容性 (#15604, @lloydhamilton)
  • [跟踪] 当 search_traces 按 run_id 过滤时,指定 attribute.run_id (#16295, @artjen)
  • [跟踪] 修复 graphql 批处理攻击 (#16227, @serena-ruan)
  • [模型注册表] 使 DatabricksSDKModelsArtifactRepository 中的块大小可配置 (#16247, @TomeHirata)

文档更新

  • [文档] 将 Lighthouse 主注册页面移至 GenAI (#16404, @BenWilson2)
  • [文档] [DOC-FIX] Dspy 文档修复 (#16397, @joelrobin18)
  • [文档] 修复(文档):解决 GenAI 追踪概览页面上自引用的“下一步”链接 (#16334, @mohammadsubhani)
  • [文档] 更新文档选择器下拉菜单 (#16280, @BenWilson2)
  • [文档] 更新 utm_source 以便源跟踪到注册 URL (#16316, @BenWilson2)
  • [文档] 修复文档在亮模式显示下的页脚渲染问题 (#16214, @BenWilson2)

有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。

MLflow 3.0.1

·阅读一分钟
MLflow maintainers
MLflow 维护者

MLflow 3.0.1 包含主要功能和错误修复。

功能

  • [模型注册表 / Sqlalchemy] 将提示文本限制从 5K 增加到 100K (#16377, @harupy)

错误修复

  • [模型] 修复 bedrock 提供商、配置的推理配置文件兼容性 (#15604, @lloydhamilton)

有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。

MLflow 3

·4 分钟阅读
MLflow maintainers
MLflow 维护者

MLflow 开源社区已经达到了一个重要的里程碑。今天,我们发布了 MLflow 3,它为数百万开发者信赖的机器学习操作平台带来了生产就绪的生成式 AI 功能。

这不仅仅是又一次功能更新。MLflow 3 从根本上扩展了开源机器学习工具的可能性,解决了生成式AI部署中可观测性和质量方面的挑战,这些挑战曾让部署感觉像是一次冒险。

主要更新

🎯 MLflow LoggedModel

MLflow 3 引入了经过改进的架构,其中新的 LoggedModel 实体作为一流公民,超越了传统的以运行为中心的方法。这使得 GenAI 代理、深度学习检查点和模型变体在不同实验中得到更好的组织和比较。

在文档中了解更多关于 MLflow LoggedModel 的信息。

🔗 强大的谱系支持

增强的模型追踪功能提供了模型、运行、追踪、提示和评估指标之间的全面谱系。新的以模型为中心的设计允许您将来自交互式查询和自动化评估作业的追踪和指标进行分组,从而实现模型版本之间的丰富比较。

新的 GenAI 评估套件

MLflow 的评估和监控功能可帮助您在整个生命周期中系统地衡量、改进和维护 GenAI 应用程序的质量。从开发到生产,使用相同的质量评分器来确保您的应用程序提供准确、可靠的响应,同时管理成本和延迟。

在文档中了解有关新GenAI 评估套件的更多信息。

信息

新的评估套件仅在 Databricks 上的托管 MLflow 中可用,开源支持即将推出。有兴趣试用吗?立即开始免费的 Databricks 试用,探索这些功能。

⚡ 提示词优化

MLflow 提示词注册表现在包含提示词优化功能,允许您使用评估反馈和带标签的数据集自动改进提示词。这包括版本控制、跟踪和系统化的提示词工程工作流。

在文档中了解更多关于提示词优化的信息。

📚 文档改版

MLflow 文档已完全重新设计,以支持两个主要用户旅程:GenAI 开发和经典机器学习工作流。新结构为 GenAI 功能(包括 LLM、提示词工程和追踪)和传统 ML 功能(如实验追踪、模型注册表、部署和评估)提供了专门的部分。

访问新的 MLflow 3 文档 以探索更新的内容和指南。

其他功能

ResponsesAgent 的流式 API:通过 ResponsesAgent 类的新流式响应功能,带有 predict_stream 方法,为 GenAI 应用程序实现实时流式传输(文档

支持 PydanticAIsmolagents 的自动追踪:增强了对新兴 GenAI 框架的自动追踪集成,提供了开箱即用的无缝可观察性(PydanticAI 文档smolagents 文档)。

为提示词注册表添加 search_prompts API:新的 API 功能,用于在注册表中搜索和发现提示词,使提示词管理更高效(API 文档:search_prompts)。

支持 OpenAI/LangChain 自动追踪的令牌追踪:增强的追踪功能现在可以捕获详细的令牌使用和成本信息,以便更好地进行可观察性和成本管理。

在追踪中记录环境元数据:MLflow 自动捕获标准环境元数据,如源名称、Git 提交哈希和执行类型,作为追踪上的标签(文档)。

UI 支持视频工件:MLflow UI 现在支持直接在工件查看器中查看视频文件,超越了传统的 ML 工件。

以及更多:跟踪、模型注册表和 UI 组件方面的众多其他增强功能,以提高可用性、性能和开发人员体验。

破坏性变更

MLflow 3 包含一些破坏性变更,作为改进框架一致性和性能的一部分。主要变更包括删除 MLflow Recipes、fastai 和 mleap flavor,以及各种已弃用的 API 参数。

有关破坏性变更的完整列表,请访问 MLflow 3 破坏性变更文档

升级建议

我们建议在将生产工作流升级到 MLflow 3 之前,在一个单独的环境中对其进行测试,以确保与您现有设置的兼容性。

开始使用

pip install 'mlflow>=3.1'

通过我们更新的快速入门指南,探索新的 MLflow 3 文档并试用增强的 GenAI 功能。以模型为中心的架构和改进的追踪功能使构建、评估和部署生产就绪的 AI 应用程序比以往任何时候都更容易。探索 MLflow 3 文档 以了解有关新功能和如何开始的更多信息。

完整更新日志

有关 MLflow 3 中所有更改、错误修复和改进的完整列表,请访问 GitHub 上的完整更改日志

MLflow 2.22.1

·阅读一分钟
MLflow maintainers
MLflow 维护者

MLflow 2.22.1 带来了重要的错误修复和改进。

功能

  • [评分] 对于 DBConnect 客户端,使 spark_udf 支持 DBR 15.4 和 DBR 专用集群 (#15938, @WeichenXu123)

错误修复

  • [模型注册表] 在 CreateModelVersion 中记录 SystemAuthPolicy 的资源 (#15485, @aravind-segu)
  • [追踪] 追踪搜索:如果 include_spans=False,则避免为 span 抓取生成线程 (#15635, @dbczumar)

有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。

MLflow 2.22.0

·2 分钟阅读
MLflow maintainers
MLflow 维护者

MLflow 2.22.0 为 UI 和跟踪功能带来了重要的错误修复和改进。

功能

  • [追踪] 支持 OpenAI Responses API 的追踪。
    (#15240, @B-Step62)
  • [追踪] 引入了 get_last_active_trace,它影响模型服务/监控逻辑。
    (#15233, @B-Step62)
  • [追踪] 引入了 Databricks 追踪的异步导出(默认行为)。
    (#15163, @B-Step62)
  • [AI 网关] 添加了 Gemini 嵌入支持,并附带相应的单元测试。
    (#15017, @joelrobin18)
  • [跟踪 / SQLAlchemy] MySQL SSL 连接现在支持客户端证书。
    (#14839, @aksylumoed)
  • [模型] 添加了 Optuna 存储实用程序以实现并行超参数调优。
    (#15243, @XiaohanZhangCMU)
  • [工件] 添加了对 Azure Data Lake Storage (ADLS) 工件存储库的支持。
    (#14723, @serena-ruan)
  • [UI] 文本工件视图现在在 UI 中自动刷新。
    (#14939, @joelrobin18)

错误修复

  • [追踪 / UI] 修复了 langchain_tracer 中结构化输出的序列化问题 + 添加了单元测试。
    (#14971, @joelrobin18)
  • [服务器基础设施] 强制执行身份验证的密码验证(至少 8 个字符)。
    (#15287, @WeichenXu123)
  • [部署] 解决了 OpenAI 网关适配器的问题。
    (#15286, @WeichenXu123)
  • [工件/追踪/服务器基础设施] 通过去除尾部斜杠来规范化路径。
    (#15016, @tarek7669)
  • [标签] 修复了包含 ": " 的标签值被截断的错误。
    (#14896, @harupy)

有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。

MLflow 2.21.1

·阅读一分钟
MLflow maintainers
MLflow 维护者

MLflow 2.21.1 是一个补丁版本,引入了次要功能并解决了一些次要错误。

功能

  • 引入对 DSPy 内评估日志记录的支持 (#14962, @TomeHirata)
  • 在执行 DSPy 编译时添加对运行创建的支持 (#14949, @TomeHirata)
  • 添加了对构建不包含 Java 的 SageMaker 服务容器的支持,通过 --install-java 选项 (#14868, @rgangopadhya)

错误修复

  • 修复了由于时间戳转换时区错误导致的追踪排序问题 (#15094, @orm011)
  • 修复了环境变量 OTEL_EXPORTER_OTLP_PROTOCOL 定义中的拼写错误 (#15008, @gabrielfu)
  • 修复了 Databricks 共享和无服务器集群在使用 evaluate API 记录 Spark 数据源时出现的问题 (#15077, @WeichenXu123)
  • 修复了 UI 中指标选项卡内图像显示渲染问题 (#15034, @TomeHirata)

文档更新

  • 在 set_retriever_schema API 文档中添加了额外的上下文信息 (#15099, @smurching)

有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。

MLflow 2.21.0

·3 分钟阅读
MLflow maintainers
MLflow 维护者

我们很高兴地宣布 MLflow 2.21.0 发布!此版本包含许多重要功能、增强和错误修复。

主要新特性

功能

错误修复

  • [模型] 修复警告处理程序模块的无限递归错误 (#14954, @BenWilson2)
  • [模型注册表] 修复 ModelRegistry RestStore 的无效类型问题 (#14980, @B-Step62)
  • [跟踪] 修复:ExperimentViewRunsControlsActionsSelectTagsset-tag 请求失败时不会将加载状态设置为 false。(#14907, @harupy
  • [追踪] 修复标签创建中的一个错误,该错误导致包含 ": " 的标签值被截断 (#14896, @harupy)
  • [追踪] 修复 AMD GPU 监控器的误报 (#14884, @B-Step62)
  • [追踪] 修复 mlflow.doctor 在找不到 mlflow 时回退到 mlflow-skinny 的问题 (#14782, @harupy)
  • [模型] 处理 LangGraph 的重大更改 (#14794, @B-Step62)

文档更新

有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。