MLflow 1.30.0
·3 分钟阅读
我们很高兴地宣布 MLflow 1.30.0 已发布!
MLflow 1.30.0 包含多项重大功能和改进。
功能
- [Pipelines] 为 MLflow Pipelines 引入超参数调优支持(#6859,@prithvikannan)
- [Pipelines] 引入对预测异常值与训练数据集进行比较的支持(#6991,@jinzhang21)
- [Pipelines] 引入对记录所有训练参数以实现可复现性的支持(#7026,#7094,@prithvikannan)
- [Pipelines] 在 ingest 步骤中添加对
Delta表作为数据源的支持(#7010,@sunishsheth2009) - [Pipelines] 添加对多达 10,000 列的数据剖析的扩展支持(#7035,@prithvikanna)
- [Pipelines] 使用 FLAML 为 MLflow Pipelines 添加 AutoML 支持(#6959,@mshtelma)
- [Pipelines] 通过允许未指定配置来添加对简化 transform 步骤执行的支持(#6909,@apurva-koti)
- [Pipelines] 在 transform 步骤卡中引入数据预览选项卡(#7033,@prithvikannan)
- [Tracking] 为
create_run、get_run和update_runAPI 引入run_name属性(#6782,#6798 @apurva-koti) - [Tracking] 为
search_experimentsAPI 添加按creation_time和last_update_time搜索的支持(#6979,@harupy) - [Tracking] 为
search_runsAPI 添加run_id IN和run ID NOT IN搜索条件的支持(#6945,@harupy) - [Tracking] 为
search_runsAPI 添加按user_id和end_time搜索的支持(#6881,#6880 @subramaniam02) - [Tracking] 为
search_runsAPI 添加按run_name和run_id搜索的支持(#6899,@harupy;#6952,@alexacole) - [Tracking] 添加对 run
name属性和mlflow.runName标签进行同步的支持(#6971,@BenWilson2) - [Tracking] 添加使用 AWSSigv4 和 AWS IAM 进行签名跟踪服务器请求的支持(#7044,@pdifranc)
- [Tracking] 引入
update_run()API 以修改现有 run 的status和name属性(#7013,@gabrielfu) - [Tracking] 为
mlflow gccli API 添加实验删除支持(#6977,@shaikmoeed) - [Models] 为
evaluate()API 添加环境恢复支持(#6728,@jerrylian-db) - [Models] 移除
evaluate()API 中对二元分类标签的限制(#7077,@dbczumar) - [Scoring] 为
mlflow.pyfunc.spark_udf()添加对BooleanType的支持(#6913,@BenWilson2) - [SQLAlchemy] 为
SqlAlchemyStore添加对可配置Pool类选项的支持(#6883,@mingyu89)
错误修复
- [Pipelines] 启用 Pipeline 子进程命令,以便在不存在 SparkSession 时创建一个新的
SparkSession(#6846,@prithvikannan) - [Pipelines] 修复 Step Card 数据剖析中
bool列类型的渲染问题(#6907,@sunishsheth2009) - [Pipelines] 添加验证,并在缺少必需的步骤文件时抛出异常(#7067,@mingyu89)
- [Pipelines] 将步骤配置验证更改为仅在步骤运行时执行(#6967,@prithvikannan)
- [Tracking] 修复在
mlflow.pyspark.ml.autolog()中推断模型 schema 时发生的无限递归 bug(#6831,@harupy) - [UI] 移除获取 artifact 失败时浏览器错误通知(#7001,@kevingreer)
- [Models] 允许
mlflow-skinny包在MLmodelrequirements 中作为基础 requirement(#6974,@BenWilson2) - [Models] 修复加载 SparkML 模型时的代码路径解析问题(#6968,@dbczumar)
- [Models] 修复记录 SparkML 模型时的依赖推断问题(#6912,@BenWilson2)
- [Models] 修复涉及 SparkML 模型潜在重复下载的问题(#6903,@serena-ruan)
- [Models] 在
mlflow.evaluate()中为sklearn.metrics.precision_recall_curve添加缺失的pos_label(#6854,@dbczumar) - [SQLAlchemy] 修复
SqlAlchemyStore中set_tag()更新错误标签的 bug(#7027,@gabrielfu)
文档更新
有关更改的完整列表,请参阅 发行版变更日志,并查看 mlflow.org 上的最新文档。
