MLflow 2.8.0
·5分钟阅读
MLflow 2.8.0 包含多项显著的新功能和改进。
- 在此版本中,MLflow Evaluate API 进行了广泛的功能开发,以支持 LLM 工作流和多种新的评估模式。请参阅 MLflow LLM Evaluate 的新文档、指南和教程以了解更多信息。
- MLflow 文档现代化工作已启动。访问文档时,您会发现其外观和感觉焕然一新,同时还有一批新的教程和指南。文档很快还将带来更多更改!
- 新增了 4 个 LLM 提供商!现在可以在 AI Gateway 中配置和使用 Google PaLM 2、AWS Bedrock、AI21 Labs 和 HuggingFace TGI。请参阅新的 AI Gateway 文档了解更多信息!
功能
- [Gateway] 为 AI Gateway 中的 AWS Bedrock 提供商添加支持(#9598,@andrew-christianson)
- [Gateway] 为 AI Gateway 中的 Huggingface Text Generation Inference 提供商添加支持(#10072,@SDonkelaarGDD)
- [Gateway] 为 AI Gateway 中的 Google PaLM 2 提供商添加支持(#9797,@arpitjasa-db)
- [Gateway] 为 AI Gateway 中的 AI21labs 提供商添加支持(#9828,#10168,@zhe-db)
- [Gateway] 通过环境变量引入一种简化 AI Gateway 配置文件的设置方法(#9822,@danilopeixoto)
- [Evaluate] 为 MLflow evaluate 引入默认提供的 LLM 评估指标(#9913,@prithvikannan)
- [Evaluate] 为 MLflow evaluate 中的推理数据集评估添加支持(#9830,@liangz1)
- [Evaluate] 为 MLflow evaluate 中评估单参数函数添加支持(#9718,@liangz1)
- [Evaluate] 为 MLflow evaluate 中的检索器 LLM 模型类型评估添加支持(#10079,@liangz1)
- [Models] 为 ONNX 格式添加外部模型保存的可配置参数,以解决回归问题(#10152,@daniellok-db)
- [Models] 在日志模型的输入示例中添加保存推理参数的支持(#9655,@serena-ruan)
- [Models] 为 OpenAI 格式添加对
completions的支持(#9838,@santiagxf) - [Models] 为 OpenAI 格式添加推理参数的支持(#9909,@santiagxf)
- [Models] 引入在加载模型时指定配置参数的支持(#9251,@santiagxf)
- [Models] 为 OpenAI 格式添加集成 Azure AD 身份验证的支持(#9704,@santiagxf)
- [Models / Scoring] 为模型服务引入模型训练谱系的支持(#9402,@M4nouel)
- [Model Registry] 引入
copy_model_version客户端 API,用于跨注册模型复制模型版本(#9946,#10078,#10140,@jerrylian-db) - [Tracking] 将参数值长度限制从 500 扩展到 6000(#9709,@serena-ruan)
- [Tracking] 引入对 Spark 3.5 的 SparkConnect 模式的支持,以便在 MLflow 中记录使用此 Spark 操作模式创建的模型(#9534,@WeichenXu123)
- [Tracking] 为 MLflow 声明式 API 添加记录系统指标的支持(#9557,#9712,#9714,@chenmoneygithub)
- [Tracking] 为 Keras 和 Tensorflow 引入 MLflow 回调(#9454,#9637,#9579,@chenmoneygithub)
- [Tracking] 在 MLflow 中引入 Databricks 的声明式登录 API(#9665,#10180,@chenmoneygithub)
- [Tracking] 支持通过插件扩展自定义 MLflow 客户端 HTTP 请求的身份验证(#10049,@lu-ohai)
- [Tracking] 引入实验性的异步日志记录支持,用于指标、参数和标签(#9705,@sagarsumant)
- [Auth] 修改 MLflow 身份验证中的用户创建行为,使其只有管理员才能创建新用户(#9700,@gabrielfu)
- [Artifacts] 支持通过插件扩展使用
xethub作为工件存储(#9957,@Kelton8Z)
错误修复
- [Evaluate] 修复 MLflow evaluate 中 Azure OpenAI 配置使用错误(#9982,@sunishsheth2009)
- [Models] 修复在 transformers 格式中,加载的模型在异构内存配置中保存时的数据一致性问题(#10087,@BenWilson2)
- [Models] 通过添加动态数据框类型,修复了 transformers 格式中复杂输入类型的问题(#9044,@wamartin-aml)
- [Models] 修复 langchain 格式中支持具有多个输出的链的问题(#9497,@bbqiu)
- [Docker] 通过将默认 env-manager 更改为 virtualenv,修复了 Docker 镜像生成的问题(#9938,@Beramos)
- [Auth] 修复 MLflow Auth 中复杂密码的问题,以支持更丰富的字符集范围(#9760,@dotdothu)
- [R] 修复在 Databricks 中运行 MLflow R 时访问配置的错误(#10117,@zacdav-db)
文档更新
- [Docs] 引入更大规模文档修订的第一阶段(#10197,@BenWilson2)
- [Docs] 添加 LLM 评估指南(#10058,#10199,@chenmoneygithub)
- [Docs] 在 ONNX 格式的 save 和 log 函数中添加强制单文件序列化的说明(#10178,@BenWilson2)
- [Docs] 为 MLflow evaluate 添加相关性指标的文档(#10170,@sunishsheth2009)
- [Docs] 为贡献指南添加关于如何构建 pydoc 字符串的样式指南(#9907,@mberk06)
- [Docs] 修复 pytorch lightning autolog 代码示例中的问题(#9964,@chenmoneygithub)
- [Docs] 更新
mlflow.data.from_numpy()的示例(#9885,@chenmoneygithub) - [Docs] 添加在 R 中安装 MLflow 的清晰说明(#9835,@darshan8850)
- [Docs] 更新模型注册表文档,添加关于模型别名支持的内容(#9721,@jerrylian-db)
有关更改的全面列表,请参阅 发布更改日志,并查看 mlflow.org 上的最新文档。
