MLflow 2.2.0
·4 分钟阅读
我们很高兴地宣布 MLflow 2.2.0 已发布!
MLflow 2.2.0 包含多项重大功能和改进
功能
- [Recipes] 为分类 recipe 添加了对分数校准的支持 (#7744, @sunishsheth2009)
- [Recipes] 为分类 recipe 添加了自动标签编码 (#7711, @sunishsheth2009)
- [Recipes] 支持分类和回归 recipe 中的自定义数据拆分逻辑 (#7815, #7588, @sunishsheth2009)
- [Recipes] 为分类和回归 recipe 引入了可自定义的 MLflow Run 名称前缀 (#7746, @kamalesh0406; #7763, @sunishsheth2009)
- [UI] 为 MLflow 实验页面添加了新的图表视图,用于模型性能洞察 (#7864, @hubertzub-db, @apurva-koti, @prithvikannan, @ridhimag11, @sunishseth2009, @dbczumar)
- [UI] 现代化并改进了用于模型调优的平行坐标图 (#7864, @hubertzub-db, @apurva-koti, @prithvikannan, @ridhimag11, @sunishseth2009, @dbczumar)
- [UI] 为 MLflow 实验页面的搜索栏添加了类型前自动提示建议 (#7864, @hubertzub-db, @apurva-koti, @prithvikannan, @ridhimag11, @sunishseth2009, @dbczumar)
- [UI] 提高了大型实验数量下实验侧边栏的性能 (#7804, @jmahlik)
- [Tracking] 引入了对原生 PyTorch 模型 autologging 的支持 (#7627, @temporaer)
- [Tracking] 在 autologging XGBoost 模型时允许指定
model_format(#7781, @guyrosin) - [Tracking] 添加了
MLFLOW_ARTIFACT_UPLOAD_DOWNLOAD_TIMEOUT环境变量以配置 artifact 操作超时 (#7783, @wamartin-aml) - [Artifacts] 从
mlflow server下载 artifact 时包含Content-Type响应头 (#7827, @bali0019) - [Model Registry] 在 Java 客户端中引入了
searchModelVersions()API (#7880, @gabrielfu) - [Model Registry] 为
MlflowClient.search_model_versions()引入了max_results,order_by和page_token参数 (#7623, @serena-ruan) - [Models] 支持通过外部数据记录大型 ONNX 模型 (#7808, @dogeplusplus)
- [Models] 添加了对记录 Spark 中拟合的 Diviner 模型支持 (#7800, @BenWilson2)
- [Models] 引入了
MLFLOW_DEFAULT_PREDICTION_DEVICE环境变量,用于设置 pyfunc 模型推理的设备 (#7922, @ankit-db) - [Scoring] 在 github.com/mlflow/mlflow/pkgs 上发布了 MLflow 模型评分服务器的官方 Docker 镜像 (#7759, @dbczumar)
错误修复
- [Recipes] 修复了自定义数据集源在 ingest 步骤中的数据集格式验证 (#7638, @sunishsheth2009)
- [Recipes] 修复了训练期间识别最差性能样本中的错误 (#7658, @sunishsheth2009)
- [Recipes] 确保调用
inspect()时 recipe 图的渲染一致性 (#7852, @sunishsheth2009) - [Recipes] 在 transform 步骤中正确处理
positive_class配置 (#7626, @sunishsheth2009) - [Recipes] 使记录的指标名称与
mlflow.evaluate()保持一致 (#7613, @sunishsheth2009) - [Recipes] 将
run_id和artifact_path键添加到记录的 MLmodel 文件中 (#7651, @sunishsheth2009) - [UI] 修复了 UI 中实验名称、模型名称和标签键验证的错误 (#7818, @subramaniam02)
- [Tracking] 在创建实验时将 artifact 位置解析为绝对路径 (#7670, @bali0019)
- [Tracking] 从 Spark 数据源 autologging 中排除 Delta 检查点 (#7902, @harupy)
- [Tracking] 当指标不存在时,一致地从 GetMetricHistory 返回空列表 (#7589, @bali0019; #7659, @harupy)
- [Artifacts] 修复了在 Windows 上对 UNC 格式路径的 artifact 操作支持 (#7750, @bali0019)
- [Artifacts] 修复了 HDFS artifact 列表中的错误 (#7581, @pwnywiz)
- [Model Registry] 在
mlflow server中禁止使用本地文件系统源创建模型版本 (#7908, @harupy) - [Model Registry] 修复了 FileStore 中已删除模型版本的处理 (#7716, @harupy)
- [Model Registry] 独立于 MLflow Tracking 正确初始化 Model Registry SQL 表 (#7704, @harupy)
- [Models] 在使用 pyfunc 进行推理时,正确地将 PyTorch 模型输出从 GPU 移到 CPU (#7885, @ankit-db)
- [Build] 修复了与使用
PYTHONOPTIMIZE=2编译的 Python 安装的兼容性问题 (#7791, @dbczumar) - [Build] 修复了与即将发布的 pandas 2.0 版本的兼容性问题 (#7899, @harupy; #7910, @dbczumar)
文档更新
- [Docs] 添加了使用 MLflow 保存和加载 Spark MLlib 模型的示例 (#7706, @dipanjank)
- [Docs] 添加了
mlflow.lightgbmAPI 的使用示例 (#7565, @canerturkseven) - [Docs] 添加了使用
sktime进行自定义模型 flavor 创建的示例 (#7624, @benjaminbluhm) - [Docs] 澄清了
mlflow.evaluate()中precision_recall_auc指标的计算 (#7701, @BenWilson2) - [Docs] 删除了过时的示例链接 (#7587, @asloan7)
有关更改的完整列表,请参阅 发布更改日志,并访问 mlflow.org 上的最新文档。
