MLflow 2.10.0 包含多项重要功能和改进!
在 MLflow 2.10 中,我们引入了许多重要的新功能,这些功能正在为当前和未来增强对深度学习用例的支持、扩展对 GenAI 应用的支持以及改进 MLflow 部署服务器(以前称为 AI Gateway)的用户体验铺平道路。
MLflow 新网站
我们有了新家。新的网站首页清新、现代,内容比以往任何时候都丰富。我们一直在添加新的内容和博客。
模型签名支持对象和数组 (#9936, @serena-ruan)
对象和数组现在可用作可配置的输入和输出模式元素。这些新类型对于以 GenAI 为重点的变体特别有用,这些变体可能具有复杂的输入和输出类型。请参阅新的 签名和输入示例文档,了解如何使用这些新的签名类型。
Langchain 自动日志记录 (#10801, @serena-ruan)
LangChain 现在支持自动日志记录!启用自动日志记录后,当您调用链时,我们将自动记录大多数链实现,为您记录和存储您配置的 LLM 应用。请参阅新的 Langchain 文档,了解如何使用此功能。
Transformers 模型的提示模板化
MLflow transformers
变体现在支持提示模板。您现在可以指定一组特定于应用的指令,将其提交到您的 GenAI 管道,以简化、精简和集成随每个输入请求提供的系统提示集。请查看更新的 transformers 指南,了解更多信息并查看示例!
MLflow 部署服务器增强功能
MLflow 部署服务器现在支持两项新的请求功能:(1) 支持流式响应的 OpenAI 端点。您现在可以配置端点以返回聊天和完成请求的实时响应,而无需等待完整的文本内容完成。(2) 现在可以按端点设置速率限制,以帮助在使用 SaaS 模型时控制成本超支。
进一步改进文档
通过扩展核心 MLflow 功能(部署、签名和模型依赖管理)以及新增 GenAI 变体的页面,我们继续努力增强文档、指南、教程和示例。今天就来看看吧!
其他功能:
- [模型] 增强 MLflow 模型
predict
API,作为环境兼容性的预日志记录验证器。(#10759, @B-Step62) - [模型] 在 transformers 变体中添加对图像分类管道的支持 (#10538, @KonakanchiSwathi)
- [模型] 添加对检索和存储 transformers 模型的许可证文件的支持 (#10871, @BenWilson2)
- [模型] 添加对 JohnSnowLabs 变体的 Visual NLP 格式模型序列化的支持 (#10603, @C-K-Loan)
- [模型] 自动将 OpenAI 输入消息转换为 LangChain 聊天消息以用于
pyfunc
predict (#10758, @dbczumar) - [跟踪] 通过确保在 Futures 对象上调用 flush 来增强异步日志记录功能 (#10715, @chenmoneygithub)
- [跟踪] 添加对
login()
API 的非交互模式的支持 (#10623, @henxing) - [评分] 允许 MLflow 模型服务支持带有
messages
键的直接dict
输入 (#10742, @daniellok-db, @B-Step62) - [部署] 为 MLflow 部署服务器添加对 OpenAI 流式返回兼容路由的流式支持 (#10765, @gabrielfu)
- [部署] 添加通过 MLflow 部署服务器直接与 OpenAI 交互的支持 (#10473, @prithvikannan)
- [UI] 为 MLflow UI 引入多项新功能 (#10864, @daniellok-db)
- [服务器基础设施] 添加一个环境变量,可以禁止 HTTP 重定向 (#10655, @daniellok-db)
- [Artifacts] 添加对 Azure Blob Storage 的分段上传支持 (#10531, @gabrielfu)
错误修复
- [模型] 为 MLflow 模型添加 pip requirements 和 extras 处理的去重逻辑 (#10778, @BenWilson2)
- [模型] 添加对 paddle 2.6.0 版本的支持 (#10757, @WeichenXu123)
- [跟踪] 修复 urllib3 1.x 重试默认超时不正确的问题 (#10839, @BenWilson2)
- [Recipes] 修复 MLflow Recipes 卡片显示格式问题 (#10893, @WeichenXu123)
- [Java] 修复在使用某些 Spark 版本上以 Delta 作为源的 Streaming Sources 时元数据收集的问题 (#10729, @daniellok-db)
- [评分] 修复 SageMaker 标签未正确传播的问题 (#9310, @clarkh-ncino)
- [Windows / Databricks] 修复在 Windows 环境中执行 Databricks 运行命令的问题 (#10811, @wolpl)
- [模型 / Databricks] 由于不稳定,禁用 JohnSnowLabs 变体的 mlflowdbfs 挂载 (#9872, @C-K-Loan)
文档更新:
- [文档] 修复了快速入门指南中的
KeyError: 'loss'
错误 (#10886, @yanmxa) - [文档] 重新定位并补充模型签名和输入示例文档 (#10838, @BenWilson2)
- [文档] 将 HuggingFace 模型评估笔记本添加到网站 (#10789, @BenWilson2)
- [文档] 重写搜索运行文档 (#10863, @chenmoneygithub)
- [文档] 创建 transformers 提示模板文档 (#10836, @daniellok-db)
- [文档] 重构入门页面 (#10798, @BenWilson2)
- [文档] 添加模型依赖管理指南 (#10807, @B-Step62)
- [文档] 添加 LangChain 教程和指南 (#10770, @BenWilson2)
- [文档] 重构深度学习文档首页部分内容 (#10736, @chenmoneygithub)
- [文档] 重构和全面修改部署文档并添加新教程 (#10726, @B-Step62)
- [文档] 添加 PyTorch 首页、快速入门和指南 (#10687, #10737 @chenmoneygithub)
- [文档] 在 OpenAI 变体文档中添加更多教程 (#10700, @BenWilson2)
- [文档] 通过演示如何使用 Databricks Community Edition 来增强快速入门 MLflow 的指南 (#10663, @BenWilson2)
- [文档] 创建 OpenAI 变体首页和入门笔记本 (#10622, @BenWilson2)
- [文档] 重构 Tensorflow 变体 API 文档 (#10662, @chenmoneygithub)
有关更改的完整列表,请参阅发布更改日志,并在mlflow.org上查看最新的文档。