我们很高兴宣布 MLflow 1.24.0 可用!
MLflow 1.24.0 包含多项主要特性和改进
特性
- [跟踪] 支持通过 `mlflow server --serve-artifacts` 经由 MLflow 服务器上传、下载和列出工件(#5320, @BenWilson2, @harupy)
- [跟踪] 向 `mlflow.autolog()` 添加 `registered_model_name` 参数,用于在自动日志记录期间进行模型自动注册(#5395, @WeichenXu123)
- [UI] 改进并重组“比较运行”页面。新增功能包括“仅显示差异”切换开关和可滚动表格(#5306, @WeichenXu123)
- [模型] 为 pmdarima 模型引入 `mlflow.pmdarima` 风格(#5373, @BenWilson2)
- [模型] 加载 MLflow 模型时,如果检测到当前环境与模型依赖项之间存在不匹配,则打印警告(#5368, @WeichenXu123)
- [模型] 支持使用 `mlflow.evaluate()` 在模型评估期间计算自定义标量指标(#5389, @MarkYHZhang)
- [评分] 添加支持通过 MLflow 部署 API 部署和评估 SageMaker 模型(#4971, #5396, @jamestran201)
错误修复和文档更新
- [跟踪 / UI] 修复在 `--serve-artifacts` 模式下运行 MLflow 服务器时发生的工件列表和下载失败问题(#5409, @dbczumar)
- [跟踪] 在 `--serve-artifacts` 模式下向 MLflow 服务器发出工件请求时,支持基于环境变量的身份验证(#5370, @TimNooren)
- [跟踪] 修复在 `--serve-artifacts` 模式下向 MLflow 服务器发出工件请求时主机名和路径解析中的错误(#5384, #5385, @mert-kirpici)
- [跟踪] 修复在使用 `mlflow.log_figure()` 但未导入 `matplotlib.figure` 时发生的导入错误(#5406, @WeichenXu123)
- [跟踪] 在自动日志记录期间正确记录包含 `@` 符号的 XGBoost 指标(#5403, @maxfriedrich)
- [跟踪] 修复在运行搜索期间发生的 SQL Server 数据库错误(#5382, @dianacarvalho1)
- [跟踪] 从 HDFS 下载工件时,将其存储在用户指定的目录中(#5210, @DimaClaudiu)
- [跟踪 / 模型注册表] 改进大型工件和模型下载的性能(#5359, @mehtayogita)
- [模型] 修复 fast.ai PyFunc 对具有 2D 输出的模型进行的推理行为(#5411, @santiagxf)
- [模型] 调用 `mlflow.spark.log_model()` 时,将 Spark 模型信息记录到当前运行中(#5355, @szczeles)
- [模型] 使用 `mlflow.pyfunc.load_model()` 加载 ONNX 模型时,恢复 onnxruntime 执行提供程序(#5317, @ecm200)
- [项目] 将 Docker 镜像推送超时时间增加,以便与 Docker 一起使用项目(#5363, @zanitete)
- [Python] 修复了阻止用户启用 DEBUG 级别 Python 日志输出的错误(#5362, @dbczumar)
- [文档] 添加开发人员指南,解释如何为 `mlflow.evaluate()` 构建自定义插件(#5333, @WeichenXu123)
有关更改的完整列表,请参阅版本更改日志,并查看mlflow.org上的最新文档。