MLflow 2.12.2
·2 分钟阅读
MLflow 2.12.2 是一个补丁版本,包含对现有功能的若干错误修复和集成改进。
此补丁版本中引入的新功能旨在为接下来的两个次要版本中将发布的主要功能奠定基础。
功能
- [模型] 添加环境配置标志,以在模型依赖项推断失败时引发异常而不是警告(#11903,@BenWilson2)
- [模型] 在 Transformers flavor 中添加对
llm/v1/embeddings任务的支持,以统一嵌入模型的输入和输出结构(#11795,@B-Step62) - [模型] 通过
predict_stream()为能够返回流响应的自定义pyfunc模型引入模型流式返回(#11791,#11895,@WeichenXu123) - [评估] 添加对覆盖
mlflow.evaluate中 GenAI 模型整个模型评估判断提示的支持(#11912,@apurva-koti) - [跟踪] 添加对定义部署资源元数据以在
pyfunc模型中配置部署资源的支持(#11832,#11825,#11804,@sunishsheth2009) - [跟踪] 添加对将
LangChain和自定义pyfunc模型记录为代码的支持(#11855,#11842,@sunishsheth2009) - [跟踪] 修改 MLflow 客户端行为,使其从全局异步配置状态读取(#11778,#11780,@chenmoneygithub)
- [跟踪] 增强系统指标数据收集,以包含 GPU 功耗指标(#11747,@chenmoneygithub)
错误修复
- [模型] 修复在指定
params时执行签名验证时的验证问题(#11838,@WeichenXu123) - [Databricks] 修复在 Databricks serverless 运行时中模型无法加载的问题(#11758,@WeichenXu123)
- [Databricks] 修复 Databricks serverless 运行时中,缩放的工作节点无权从驱动程序 NFS 挂载读取的问题(#11757,@WeichenXu123)
- [Databricks] 修复 Databricks serverless 运行时中,通过
spark_udf加载模型进行推理因配置问题而失败的问题(#11752,@WeichenXu123) - [Server-infra] 将 gunicorn 依赖项升级到 22 版本,以解决第三方安全问题(#11742,@maitreyakv)
文档更新
- [文档] 添加关于搜索 API 搜索语法限制的附加指南(#11892,@BenWilson2)
- [文档] 修复快速入门指南中 Keras 示例模型定义不正确的问题(#11848,@horw)
- [文档] 为 LangChain 教程和指南提供修复和更新(#11802,@BenWilson2)
- [文档] 修复文档中模型注册表示例的正确类型格式(#11789,@80rian)
有关更改的完整列表,请参阅发布更改日志,并查看 mlflow.org 上的最新文档。
