我们很高兴宣布 MLflow 1.20.0 版本发布!
注意:MLflow 1.20.0 的 R Package 尚未发布,但将在大约一周内发布,因为 CRAN 的提交系统将离线到 9 月 1 日。
除了错误和文档修复外,MLflow 1.20.0 还包含以下功能和改进
- scikit-learn 的自动日志记录现在会在调用 scikit-learn 评估 API(例如
sklearn.metrics.mean_squared_error
)时记录训练后指标 (#4491, #4628 #4638, @WeichenXu123)
- PySpark ML 的自动日志记录现在会在调用模型评估 API(例如
Evaluator.evaluate()
)时记录训练后指标 (#4686, @WeichenXu123)
- 为
mlflow.*.log_model
和 mlflow.*.save_model
添加 pip_requirements
和 extra_pip_requirements
,用于直接指定要记录/保存的模型的 pip 要求 (#4519, #4577, #4602, @harupy)
- 在 PySpark CrossValidator 自动日志记录期间记录的训练指标中添加
stdMetrics
条目 (#4672, @WeichenXu123)
- MLflow UI 更新
- 改进了用于运行性能比较的平行坐标图的可扩展性,
- 在实验页面添加了根据运行开始时间过滤运行的支持,
- 在实验页面添加了运行表格列排序的下拉菜单,
- 将用于在实验页面加载运行表格的 AG Grid 插件升级到 25.0.0 版本,
- 修复了实验页面上的一个错误,该错误导致在选择其他表格部分的列时,运行表格的指标部分折叠 (#4712, @dbczumar)
- 为 PyTorch Lightning 的自动日志记录添加了分布式执行支持 (#4717, @dbczumar)
- 扩展了 R 对模型注册功能的支持 (#4527, @bramrodenburg)
- 添加了模型评分服务器支持,用于定义自定义预测响应包装器 (#4611, @Ark-kun)
mlflow.*.log_model
和 mlflow.*.save_model
现在会根据当前软件环境自动推断要记录/保存的模型的 pip 要求 (#4518, @harupy)
- 引入了使用 MLflow 模型运行 SageMaker Batch Transform 作业的支持 (#4410, #4589, @YQ-Wang)
有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。