MLflow 2.13.0 包含多项主要特性和改进
在此版本中,我们很高兴引入多项特性,这些特性在各种使用场景下广泛增强了 MLflow 的可用性。
主要特性和改进:
-
可流式处理的 Python 模型:新引入的 Python 模型
predict_stream
API 允许自定义模型实现支持返回生成器对象,从而为 GenAI 应用提供完全的定制能力。 -
增强的代码依赖推断:一项新特性,可根据模型实现中检测到的依赖关系自动推断代码依赖项。作为
code_paths
参数的补充,在记录模型时引入的infer_model_code_paths
选项将确定需要哪些额外的代码模块,以确保您的模型可以独立加载、部署和可靠存储。 -
MLflow 部署服务器的标准化:部署服务器的端点输出现在符合 OpenAI 的接口规范,以便更轻松地与常用服务集成。
特性
- [部署] 更新 MLflow 部署服务器接口以兼容 OpenAI (#12003, @harupy)
- [部署] 添加 Togetherai 作为 MLflow 部署服务器支持的提供商 (#11557, @FotiosBistas)
- [模型] 添加对 Python 模型
predict_stream
API 的支持 (#11791, @WeichenXu123) - [模型] 增强记录 MLflow 模型代码依赖的能力 (#11806, @WeichenXu123)
- [模型] 添加对 LangChain 中 RunnableBinding 模型的支持 (#11980, @serena-ruan)
- [模型注册表 / Databricks] 添加对重命名注册到 Unity Catalog 的模型的支持 (#11988, @artjen)
- [模型注册表 / Databricks] 改进处理从 Unity Catalog 注册模型搜索无效组件的问题 (#11961, @artjen)
- [模型注册表] 增强重试逻辑和凭据刷新功能,以减轻上传或下载 artifact 时因云提供商令牌过期导致的失败 (#11614, @artjen)
- [Artifacts / Databricks] 添加从 Unity Catalog 加载模型的增强血缘跟踪功能 (#11305, @shichengzhou-db)
- [跟踪] 向 Pyfunc 模型添加资源元数据,以帮助模型服务环境配置 (#11832, @sunishsheth2009)
- [跟踪] 增强 LangChain 将模型作为代码的签名推断能力 (#11855, @sunishsheth2009)
Bug 修复
- [Artifacts] 禁止对 AWS 上的分段上传使用无效配置选项 (#11975, @ian-ack-db)
- [模型注册表] 强制注册模型元数据相等 (#12013, @artjen)
- [模型] 修正 AttrDict 使用中
hasattr
引用问题 (#11999, @BenWilson2)
文档更新
- [文档] 简化主文档首页 (#12017, @BenWilson2)
- [文档] 添加关于扩展代码路径推断特性的文档 (#11997, @BenWilson2)
- [文档] 添加关于
predict_stream
API 的文档指南 (#11976, @BenWilson2) - [文档] 添加对使用 JFrog MLflow 插件增强文档的支持 (#11426, @yonarbel)
有关完整的更改列表,请参阅 版本更改日志,并在 mlflow.org 查看最新文档。