MLflow 1.30.0

2022年10月19日 ·3分钟阅读

MLflow 维护者

我们很高兴地宣布 MLflow 1.30.0 已发布！

MLflow 1.30.0 包含多项重要功能和改进

功能

[管道] 在 MLflow 管道中引入超参数调优支持 (#6859, @prithvikannan)
[管道] 引入支持将预测异常值与训练数据集进行比较 (#6991, @jinzhang21)
[管道] 引入支持记录所有训练参数以实现可复现性 (#7026, #7094, @prithvikannan)
[管道] 添加对在 Ingest 步骤中使用 Delta 表作为数据源的支持 (#7010, @sunishsheth2009)
[管道] 添加了对最多 10,000 列的数据分析的扩展支持 (#7035, @prithvikanna)
[管道] 添加了在 MLflow 管道中使用 FLAML 支持 AutoML 的功能 (#6959, @mshtelma)
[管道] 添加了对简化 Transform 步骤执行的支持，允许未指定配置 (#6909, @apurva-koti)
[管道] 在 Transform 步骤卡片中引入了数据预览选项卡 (#7033, @prithvikannan)
[跟踪] 在 create_run、get_run 和 update_run API 中引入了 run_name 属性 (#6782, #6798 @apurva-koti)
[跟踪] 在 search_experiments API 中添加了按 creation_time 和 last_update_time 搜索的支持 (#6979, @harupy)
[跟踪] 在 search_runs API 中添加了对搜索词 run_id IN 和 run ID NOT IN 的支持 (#6945, @harupy)
[跟踪] 在 search_runs API 中添加了按 user_id 和 end_time 搜索的支持 (#6881, #6880 @subramaniam02)
[跟踪] 在 search_runs API 中添加了按 run_name 和 run_id 搜索的支持 (#6899, @harupy; #6952, @alexacole)
[跟踪] 添加了对 Run 的 name 属性与 mlflow.runName 标签同步的支持 (#6971, @BenWilson2)
[跟踪] 添加了使用 AWSSigv4 和 AWS IAM 对跟踪服务器请求进行签名支持 (#7044, @pdifranc)
[跟踪] 引入了 update_run() API，用于修改现有 Run 的 status 和 name 属性 (#7013, @gabrielfu)
[跟踪] 在 mlflow gc CLI API 中添加了实验删除支持 (#6977, @shaikmoeed)
[模型] 在 evaluate() API 中添加了环境恢复支持 (#6728, @jerrylian-db)
[模型] 移除了 evaluate() API 中对二元分类标签的限制 (#7077, @dbczumar)
[评分] 向 mlflow.pyfunc.spark_udf() 添加了对 BooleanType 的支持 (#6913, @BenWilson2)
[SQLAlchemy] 添加了对 SqlAlchemyStore 可配置 Pool 类选项的支持 (#6883, @mingyu89)

错误修复

[管道] 如果 SparkSession 不存在，则启用管道子进程命令创建新的 SparkSession (#6846, @prithvikannan)
[管道] 修复了 Step Card 数据配置文件中 bool 列类型的渲染问题 (#6907, @sunishsheth2009)
[管道] 如果缺少必需的步骤文件，则添加验证和异常处理 (#7067, @mingyu89)
[管道] 将步骤配置验证更改为仅在步骤运行时执行期间进行 (#6967, @prithvikannan)
[跟踪] 修复了在 mlflow.pyspark.ml.autolog() 中推断模型架构时无限递归的错误 (#6831, @harupy)
[UI] 移除无法获取 Artifacts 时出现的浏览器错误通知 (#7001, @kevingreer)
[模型] 允许 mlflow-skinny 包作为 MLmodel 要求中的基础要求 (#6974, @BenWilson2)
[模型] 修复了加载 SparkML 模型时代码路径解析的问题 (#6968, @dbczumar)
[模型] 修复了记录 SparkML 模型时依赖推理的问题 (#6912, @BenWilson2)
[模型] 修复了 SparkML 模型可能重复下载的问题 (#6903, @serena-ruan)
[模型] 在 mlflow.evaluate() 中向 sklearn.metrics.precision_recall_curve 添加了缺失的 pos_label (#6854, @dbczumar)
[SQLAlchemy] 修复了 SqlAlchemyStore 中 set_tag() 更新错误标签的错误 (#7027, @gabrielfu)

文档更新

[模型] 更新了有关默认 Keras 序列化格式的详细信息 (#7022, @balvisio)

有关更改的完整列表，请参阅发布版本更改日志，并在mlflow.org上查阅最新文档。