跳到主要内容

MLflow 2.15.0

·5分钟阅读
MLflow maintainers
MLflow 维护者

我们很高兴地宣布 MLflow 2.15.0 发布!!此版本包含许多主要功能和改进。

主要功能:

  • LlamaIndex Flavor🦙 - MLflow 现在提供了与 LlamaIndex 的原生集成,LlamaIndex 是构建围绕自定义数据的 GenAI 应用程序最受欢迎的库之一。此集成允许您在 MLflow 中记录 LlamaIndex 索引,从而能够加载和部署您的索引数据,以便与不同引擎类型进行推理任务。MLflow 还为 LlamaIndex 操作提供了全面的跟踪支持,为复杂的查询提供了前所未有的透明度。请查看 MLflow LlamaIndex 文档开始!(#12633, @michael-berk, @B-Step62)

  • OpenAI 跟踪🔍 - 我们通过一项新的跟踪功能增强了 OpenAI 集成,该功能与 MLflow OpenAI 自动日志记录无缝配合。您现在可以通过一次 mlflow.openai.autolog() 调用来启用对 OpenAI API 使用情况的跟踪,从而 MLflow 将自动记录有价值的元数据,例如令牌使用情况和您的交互历史记录,从而更深入地了解您的 OpenAI 驱动的应用程序。要开始探索此新功能,请参阅 跟踪文档!(#12267, @gabrielfu)

  • 通过新验证功能增强模型部署✅ - 为提高模型部署的可靠性,MLflow 添加了一个新方法,可在将模型部署到推理端点之前对其进行验证。此功能有助于消除输入和输出处理中的典型错误,从而简化模型部署过程并提高对已部署模型的信心。通过及早发现潜在问题,可以确保从开发到生产的更顺畅的过渡。( #12710, @serena-ruan)

  • 自定义指标定义记录用于评估📊 - 我们通过自动记录和版本化指标定义(包括用作评估器的模型和提示模板)来加强定义用于模型评估的自定义指标的灵活性。有了此新功能,您可以确保跨不同运行的评估的可重复性,并轻松重用评估设置以保持一致性,从而促进不同模型或版本之间更有意义的比较。( #12487, #12509, @xq-yin)

  • Databricks SDK 集成🔐 - MLflow 与 Databricks 端点的交互已完全迁移到使用 Databricks SDK。此更改带来了 MLflow 和 Databricks 之间更强大、更可靠的连接,并能访问最新的 Databricks 功能。我们将旧的 databricks-cli 支持标记为已弃用,并将在未来的版本中删除。( #12313, @WeichenXu123)

  • Spark VectorUDT 支持💥 - MLflow 的 模型签名框架现在支持 Spark Vector UDT(用户定义类型),从而能够记录和部署使用 Spark VectorUDT 的模型,并提供强大的类型验证。( #12758, @WeichenXu123)

其他值得注意的更改

功能

  • [跟踪] 为 start_run 链式 API 添加 parent_id 参数,以实现替代流程控制。( #12721, @Flametaa)
  • [跟踪] 添加 U2M 身份验证支持,用于从 MLflow 连接到 Databricks。( #12713, @WeichenXu123)
  • [跟踪] 支持使用 mlflow gc 删除远程工件。( #12451, @M4nouel)
  • [跟踪] [UI] 现在可以方便地从实验页面的“跟踪”选项卡中通过 UI 删除跟踪。( #12641, @daniellok-db)
  • [模型] 为 GenAI Flavor 引入 ChatModel 接口的附加参数。( #12612, @WeichenXu123)
  • [模型] [Transformers] 支持使用 b64.encodebytes 编码的输入图像。( #12087, @MadhuM02)
  • [模型注册表] 为 Databricks UC 模型注册表集成添加对 AWS KMS 加密的とサポート。( #12495, @artjen)
  • [模型] 修复 MLflow 数据集哈希逻辑,用于 Pandas DataFrame,使用 iloc 访问行。( #12410, @julcsii)
  • [模型注册表] 支持不带头部的预签名 URL 用于工件位置。( #12349, @artjen)
  • [UI] MLflow UI 中的实验页面外观已更新,并对折线图进行了性能优化。( #12641, @hubertzub-db)
  • [UI] 折线图现在可以配置为忽略数据中的异常值。( #12641, @daniellok-db)
  • [UI] 与 Kubeflow Dashboard UI 兼容。( #12663, @cgilviadee)
  • [UI] 在跟踪 UI 的工件页面中添加了一个新部分,其中显示了部署前用于验证模型输入格式的代码片段。( #12729, @serena-ruan)

错误修复

  • [跟踪] 修复 MLflow SHAP 评估中 scikit-learn 模型的模型构造错误。( #12599, @serena-ruan)
  • [跟踪] File store get_experiment_by_name 返回所有阶段的实验。( #12788, @serena-ruan)
  • [跟踪] 修复 Langchain 回调注入逻辑,用于异步/流式请求。( #12773, @B-Step62)
  • [跟踪] [OpenAI] 修复 OpenAI 的流式跟踪,以记录正确的块结构。( #12629, @BenWilson2)
  • [跟踪] [LangChain] 修复 LangChain 跟踪中由于线程不安全导致的 .batch 调用错误。( #12701, @B-Step62)
  • [跟踪] [LangChain] 修复 LangChain 跟踪中的嵌套跟踪问题。( #12705, @B-Step62)
  • [跟踪] 防止 MLflow 跟踪与其他基于 OpenTelemetry 的库之间发生干预。( #12457, @B-Step62)
  • [模型] 修复 MLflow >= 2.13 中 log_model 的问题,该问题导致 databricks DLT py4j 服务崩溃。( #12514, @WeichenXu123)
  • [模型] [Transformers] 修复 Transformers Whisper 模型的批处理推理问题。( #12575, @B-Step62)
  • [模型] [LangChain] 修复 AgentExecutor 和其他非 Runnable 链的 predict_stream 中的空生成器问题。( #12518, @B-Step62)
  • [评分] 修复 Databricks 运行时中的 Spark UDF 权限被拒绝问题。( #12774, @WeichenXu123)

文档更新

有关更改的完整列表,请参阅 发布更改日志,并查看 mlflow.org 上的最新文档。