我们很高兴地宣布 MLflow 1.30.0 已发布!
MLflow 1.30.0 包含多项重要功能和改进
功能
- [管道] 在 MLflow 管道中引入超参数调优支持 (#6859, @prithvikannan)
- [管道] 引入支持将预测异常值与训练数据集进行比较 (#6991, @jinzhang21)
- [管道] 引入支持记录所有训练参数以实现可复现性 (#7026, #7094, @prithvikannan)
- [管道] 添加对在 Ingest 步骤中使用
Delta
表作为数据源的支持 (#7010, @sunishsheth2009) - [管道] 添加了对最多 10,000 列的数据分析的扩展支持 (#7035, @prithvikanna)
- [管道] 添加了在 MLflow 管道中使用 FLAML 支持 AutoML 的功能 (#6959, @mshtelma)
- [管道] 添加了对简化 Transform 步骤执行的支持,允许未指定配置 (#6909, @apurva-koti)
- [管道] 在 Transform 步骤卡片中引入了数据预览选项卡 (#7033, @prithvikannan)
- [跟踪] 在
create_run
、get_run
和update_run
API 中引入了run_name
属性 (#6782, #6798 @apurva-koti) - [跟踪] 在
search_experiments
API 中添加了按creation_time
和last_update_time
搜索的支持 (#6979, @harupy) - [跟踪] 在
search_runs
API 中添加了对搜索词run_id IN
和run ID NOT IN
的支持 (#6945, @harupy) - [跟踪] 在
search_runs
API 中添加了按user_id
和end_time
搜索的支持 (#6881, #6880 @subramaniam02) - [跟踪] 在
search_runs
API 中添加了按run_name
和run_id
搜索的支持 (#6899, @harupy; #6952, @alexacole) - [跟踪] 添加了对 Run 的
name
属性与mlflow.runName
标签同步的支持 (#6971, @BenWilson2) - [跟踪] 添加了使用 AWSSigv4 和 AWS IAM 对跟踪服务器请求进行签名支持 (#7044, @pdifranc)
- [跟踪] 引入了
update_run()
API,用于修改现有 Run 的status
和name
属性 (#7013, @gabrielfu) - [跟踪] 在
mlflow gc
CLI API 中添加了实验删除支持 (#6977, @shaikmoeed) - [模型] 在
evaluate()
API 中添加了环境恢复支持 (#6728, @jerrylian-db) - [模型] 移除了
evaluate()
API 中对二元分类标签的限制 (#7077, @dbczumar) - [评分] 向
mlflow.pyfunc.spark_udf()
添加了对BooleanType
的支持 (#6913, @BenWilson2) - [SQLAlchemy] 添加了对
SqlAlchemyStore
可配置Pool
类选项的支持 (#6883, @mingyu89)
错误修复
- [管道] 如果 SparkSession 不存在,则启用管道子进程命令创建新的
SparkSession
(#6846, @prithvikannan) - [管道] 修复了 Step Card 数据配置文件中
bool
列类型的渲染问题 (#6907, @sunishsheth2009) - [管道] 如果缺少必需的步骤文件,则添加验证和异常处理 (#7067, @mingyu89)
- [管道] 将步骤配置验证更改为仅在步骤运行时执行期间进行 (#6967, @prithvikannan)
- [跟踪] 修复了在
mlflow.pyspark.ml.autolog()
中推断模型架构时无限递归的错误 (#6831, @harupy) - [UI] 移除无法获取 Artifacts 时出现的浏览器错误通知 (#7001, @kevingreer)
- [模型] 允许
mlflow-skinny
包作为MLmodel
要求中的基础要求 (#6974, @BenWilson2) - [模型] 修复了加载 SparkML 模型时代码路径解析的问题 (#6968, @dbczumar)
- [模型] 修复了记录 SparkML 模型时依赖推理的问题 (#6912, @BenWilson2)
- [模型] 修复了 SparkML 模型可能重复下载的问题 (#6903, @serena-ruan)
- [模型] 在
mlflow.evaluate()
中向sklearn.metrics.precision_recall_curve
添加了缺失的pos_label
(#6854, @dbczumar) - [SQLAlchemy] 修复了
SqlAlchemyStore
中set_tag()
更新错误标签的错误 (#7027, @gabrielfu)
文档更新
有关更改的完整列表,请参阅发布版本更改日志,并在mlflow.org上查阅最新文档。