我们很高兴宣布 MLflow 1.20.0 现已发布!
注意:MLflow 1.20.0 的 R 软件包尚未发布,但由于 CRAN 的提交系统将离线至9月1日,预计会在一周内发布。
除了错误修复和文档更新外,MLflow 1.20.0 还包含以下特性和改进
- scikit-learn 的自动日志记录现在可以在调用 scikit-learn 评估 API(例如
sklearn.metrics.mean_squared_error
)时记录训练后指标(#4491, #4628 #4638, @WeichenXu123) - PySpark ML 的自动日志记录现在可以在调用模型评估 API(例如
Evaluator.evaluate()
)时记录训练后指标(#4686, @WeichenXu123) - 为
mlflow.*.log_model
和mlflow.*.save_model
添加了pip_requirements
和extra_pip_requirements
参数,用于直接指定要记录/保存的模型的 pip 依赖项(#4519, #4577, #4602, @harupy) - 在 PySpark CrossValidator 自动日志记录期间记录的训练指标中添加了
stdMetrics
条目(#4672, @WeichenXu123) - MLflow UI 更新
- 为 PyTorch Lightning 的自动日志记录添加了对分布式执行的支持(#4717, @dbczumar)
- 扩展了 R 对模型注册表功能的支持(#4527, @bramrodenburg)
- 添加了模型评分服务器支持,用于定义自定义预测响应包装器(#4611, @Ark-kun)
mlflow.*.log_model
和mlflow.*.save_model
现在会根据当前的软件环境自动推断要记录/保存的模型的 pip 依赖项(#4518, @harupy)- 引入了使用 MLflow 模型运行 Sagemaker Batch Transform 作业的支持(#4410, #4589, @YQ-Wang)
有关更改的完整列表,请参阅版本更改日志,并查看 mlflow.org 上的最新文档。