MLflow 2.8.0 包含几个重要的新功能和改进
- MLflow Evaluate API 在此版本中进行了广泛的功能开发,以支持 LLM 工作流和多种新的评估模式。请参阅 MLflow LLM Evaluate 的新文档、指南和教程以了解更多信息。
- MLflow 文档现代化工作已经启动。访问文档时,您将看到截然不同的外观和使用体验,以及一批新的教程和指南。更多文档变更即将推出!
- 新增了 4 个 LLM 提供商!现在可以在 AI 网关中配置和使用 Google PaLM 2、AWS Bedrock、AI21 Labs 和 HuggingFace TGI。在新的 AI 网关文档中了解更多!
新功能
- [网关] 在 AI 网关中添加对 AWS Bedrock 作为提供商的支持 (#9598, @andrew-christianson)
- [网关] 在 AI 网关中添加对 Huggingface Text Generation Inference 作为提供商的支持 (#10072, @SDonkelaarGDD)
- [网关] 在 AI 网关中添加对 Google PaLM 2 作为提供商的支持 (#9797, @arpitjasa-db)
- [网关] 在 AI 网关中添加对 AI21labs 作为提供商的支持 (#9828, #10168, @zhe-db)
- [网关] 引入一种通过环境变量设置 AI 网关配置文件位置的简化方法 (#9822, @danilopeixoto)
- [Evaluate] 为 MLflow evaluate 引入默认提供的 LLM 评估指标 (#9913, @prithvikannan)
- [Evaluate] 在 MLflow evaluate 中添加对评估推理数据集的支持 (#9830, @liangz1)
- [Evaluate] 在 MLflow evaluate 中添加对评估单参数函数的支持 (#9718, @liangz1)
- [Evaluate] 在 MLflow evaluate 中添加对 Retriever LLM 模型类型评估的支持 (#10079, @liangz1)
- [Models] 在 ONNX 风格中添加外部模型保存的可配置参数,以解决回归问题 (#10152, @daniellok-db)
- [Models] 在日志记录模型的输入示例中添加对保存推理参数的支持 (#9655, @serena-ruan)
- [Models] 在 OpenAI 风格中添加对
completions
的支持 (#9838, @santiagxf) - [Models] 在 OpenAI 风格中添加对推理参数的支持 (#9909, @santiagxf)
- [Models] 引入在加载模型时指定配置参数的支持 (#9251, @santiagxf)
- [Models] 在 OpenAI 风格中添加对集成 Azure AD 身份验证的支持 (#9704, @santiagxf)
- [Models / Scoring] 在模型服务中引入对模型训练谱系的支持 (#9402, @M4nouel)
- [Model Registry] 引入
copy_model_version
客户端 API,用于在注册模型之间复制模型版本 (#9946, #10078, #10140, @jerrylian-db) - [Tracking] 将参数值长度限制从 500 扩展到 6000 (#9709, @serena-ruan)
- [Tracking] 在 MLflow 中引入对 Spark 3.5 SparkConnect 模式的支持,以允许记录使用此操作模式创建的模型 (#9534, @WeichenXu123)
- [Tracking] 在 MLflow 流畅 API 中添加对日志记录系统指标的支持 (#9557, #9712, #9714, @chenmoneygithub)
- [Tracking] 在 MLflow 中为 Keras 和 Tensorflow 添加回调函数 (#9454, #9637, #9579, @chenmoneygithub)
- [Tracking] 在 MLflow 中引入 Databricks 的流畅登录 API (#9665, #10180, @chenmoneygithub)
- [Tracking] 通过插件扩展添加支持自定义 MLflow 客户端 HTTP 请求的身份验证 (#10049, @lu-ohai)
- [Tracking] 引入对指标、参数和标签的实验性异步日志记录支持 (#9705, @sagarsumant)
- [Auth] 修改 MLflow Authentication 中用户创建的行为,只有管理员可以创建新用户 (#9700, @gabrielfu)
- [Artifacts] 通过插件扩展添加支持使用
xethub
作为 artifact store (#9957, @Kelton8Z)
错误修复
- [Evaluate] 修复 MLflow evaluate 中 Azure OpenAI 配置使用的一个错误 (#9982, @sunishsheth2009)
- [Models] 修复 transformers 风格中加载到异构内存配置的模型保存时的数据一致性问题 (#10087, @BenWilson2)
- [Models] 通过添加动态数据框类型修复 transformers 风格中复杂输入类型的问题 (#9044, @wamartin-aml)
- [Models] 修复 langchain 风格中的问题,以支持具有多个输出的链 (#9497, @bbqiu)
- [Docker] 通过将默认 env-manager 更改为 virtualenv 修复 Docker 镜像生成问题 (#9938, @Beramos)
- [Auth] 修复 MLflow Auth 中复杂密码的问题,以支持更丰富的字符集范围 (#9760, @dotdothu)
- [R] 修复在 Databricks 中运行 MLflow R 时配置访问的错误 (#10117, @zacdav-db)
文档更新
- [Docs] 引入大型文档 overhaul 的第一阶段 (#10197, @BenWilson2)
- [Docs] 添加 LLM eval 指南 (#10058, #10199, @chenmoneygithub)
- [Docs] 添加关于如何在 onnx 风格的 save 和 log 函数中强制执行单文件序列化的说明 (#10178, @BenWilson2)
- [Docs] 添加 MLflow evaluate 相关性指标的文档 (#10170, @sunishsheth2009)
- [Docs] 为贡献指南添加关于如何组织 pydoc 字符串的风格指南 (#9907, @mberk06)
- [Docs] 修复 pytorch lightning autolog 代码示例的问题 (#9964, @chenmoneygithub)
- [Docs] 更新
mlflow.data.from_numpy()
的示例 (#9885, @chenmoneygithub) - [Docs] 添加在 R 中安装 MLflow 的清晰说明 (#9835, @darshan8850)
- [Docs] 更新模型注册表文档,添加有关模型别名支持的内容 (#9721, @jerrylian-db)
有关更改的完整列表,请参阅版本更改日志,并查看 mlflow.org 上的最新文档。