发布版本 | MLflow 平台

MLflow 1.26.1

2022年5月27日 ·阅读时长 1 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.26.1 版本发布！

MLflow 1.26.1 是一个包含以下错误修复的补丁版本

[安装] 修复与 protobuf >= 4.21.0 的兼容性问题 (#5945, @harupy)
[模型] 修复 get_model_dependencies 对包含工件路径的 models: URI 的行为 (#5921, @harupy)
[模型] 恢复 MLflow 1.25.0 中引入的、对 mlflow.pyfunc.log_model() 中工件持久性的一个有问题更改 (#5891, @kyle-jarvis)
[模型] 当 mlflow.evaluate() 的 EvaluationArtifact 输出被垃圾回收时，关闭相关的图像文件 (#5900, @WeichenXu123)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.26.0

2022年5月16日 ·阅读时长 3 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.26.0 版本发布！

MLflow 1.26.0 包含几个主要功能和改进

功能

[CLI] 向部署 CLI 添加端点命名和选项配置 (#5731, @trangevi)
[构建,文档] 为 Linux 和 MacOS x86 操作系统添加开发环境设置脚本 (#5717, @BenWilson2)
[跟踪] 更新 mlflow.set_tracking_uri 以支持除了现有 str 路径声明之外、定义为 pathlib.Path 的路径 (#5824, @cacharle)
[评分] 向评分服务器 CLI 添加自定义超时覆盖选项以支持高延迟模型 (#5663, @sniafas)
[UI] 在实验运行列表表格中添加粘性表头，以便在滚动超出页面首屏时支持列名可见性 (#5818, @hubertzub-db)
[工件] 添加 GCS 对 MLflow 垃圾收集的支持 (#5811, @aditya-iyengar-rtl-de)
[评估] 为 eval_and_log_metrics API 添加 pos_label 参数，以支持准确的二元分类器评估指标 (#5807, @yxiong)
[UI] 在指标显示页面上添加最新、最小值和最大值指标字段 (#5574, @adamreeve)
[模型] 使用自动日志记录时，为 PySpark ML Flavor 添加 input_example 和 signature 日志记录支持 (#5719, @bali0019)
[模型] 为 mlflow models docker-build CLI 添加 virtualenv 环境管理器支持 (#5728, @harupy)
[模型] 为 PySpark 模型在 log_model_allowlist 中添加通配符模块匹配支持 (#5723, @serena-ruan)
[项目] 为 MLflow 项目添加 virtualenv 环境管理器支持 (#5631, @harupy)
[模型] 为 MLflow 模型添加 virtualenv 环境管理器支持 (#5380, @harupy)
[模型] 为 mlflow.pyfunc.spark_udf 添加 virtualenv 环境管理器支持 (#5676, @WeichenXu123)
[模型] 使用自动日志记录时，为 TensorFlow Flavor 添加 input_example 和 signature 日志记录支持 (#5510, @bali0019)
[服务器基础设施] 添加 JSON Schema 类型验证，以便对 REST API 端点的格式错误请求引发 400 错误 (#5458, @mrkaye97)
[评分] 为 MLflow 部署引入抽象端点接口 (#5378, @trangevi)
[UI] 在运行比较页面添加“结束时间”和“持续时间”字段 (#3378, @RealArpanBhattacharya)
[Serving] 为模型 Serving 解析输入 CSV 数据时添加模式验证支持 (#5531, @vvijay-bolt)

错误修复和文档更新

[模型] 修复 Spark 数据源中 REPL ID 从数据源监听器传播到发布器的问题 (#5826, @dbczumar)
[UI] 更新 ag-grid 并实现 getRowId 以改进运行表格可视化的性能 (#5725, @adamreeve)
[Serving] 修复 tf-serving 解析以支持基于列的格式 (#5825, @arjundc-db)
[工件] 更新 log_artifact 以支持 HDFS 中大于 2GB 的模型 (#5812, @hitchhicker)
[模型] 修复自动日志记录以支持名称中包含“@”符号的 LightGBM 指标名称 (#5785, @mengchendd)
[模型] Pyfunc: 修复子目录的代码目录解析 (#5806, @dbczumar)
[服务器基础设施] 修复 mlflow-R 服务器在 Windows 上启动失败的问题 (#5767, @serena-ruan)
[文档] 添加关于 virtualenv 环境管理器支持 MLflow 项目的文档 (#5727, @harupy)
[UI] 修复工件显示尺寸，以支持在预览窗格中全宽渲染 (#5606, @szczeles)
[模型] 通过将驱动程序地址绑定到 localhost 来修复加载 Spark 模型时的本地主机名问题 (#5753, @WeichenXu123)
[模型] 修复 TensorFlow Flavor 的自动日志记录验证和 batch_size 计算 (#5683, @MarkYHZhang)
[工件] 修复 SqlAlchemyStore.log_batch 实现，使其能够批量记录数据 (#5460, @erensahin)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.24.0

2022年2月28日 ·阅读时长 2 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.24.0 版本发布！

MLflow 1.24.0 包含几个主要功能和改进

功能

[跟踪] 通过 mlflow server --serve-artifacts 支持通过 MLflow 服务器上传、下载和列出工件 (#5320, @BenWilson2, @harupy)
[跟踪] 为 mlflow.autolog() 添加 registered_model_name 参数，以便在自动日志记录期间进行自动模型注册 (#5395, @WeichenXu123)
[UI] 改进并重构运行比较页面。新增内容包括“仅显示差异”切换和可滚动表格 (#5306, @WeichenXu123)
[模型] 为 pmdarima 模型引入 mlflow.pmdarima Flavor (#5373, @BenWilson2)
[模型] 加载 MLflow 模型时，如果检测到当前环境与模型依赖项不匹配，则打印警告 (#5368, @WeichenXu123)
[模型] 支持使用 mlflow.evaluate() 在模型评估期间计算自定义标量指标 (#5389, @MarkYHZhang)
[评分] 添加通过 MLflow 部署 API <https://mlflow.org.cn/docs/latest/models.html#deployment-to-custom-targets>_ 部署和评估 SageMaker 模型的支持 (#4971, #5396, @jamestran201)

错误修复和文档更新

[跟踪 / UI] 修复在 --serve-artifacts 模式下运行 MLflow 服务器时发生的工件列表和下载失败 (#5409, @dbczumar)
[跟踪] 在 --serve-artifacts 模式下向 MLflow 服务器发出工件请求时，支持基于环境变量的身份验证 (#5370, @TimNooren)
[跟踪] 修复在 --serve-artifacts 模式下向 MLflow 服务器发出工件请求时发生的主机名和路径解析错误 (#5384, #5385, @mert-kirpici)
[跟踪] 修复在使用 mlflow.log_figure() 时未导入 matplotlib.figure 导致的导入错误 (#5406, @WeichenXu123)
[跟踪] 在自动日志记录期间正确记录包含“@”符号的 XGBoost 指标 (#5403, @maxfriedrich)
[跟踪] 修复在运行搜索期间发生的 SQL Server 数据库错误 (#5382, @dianacarvalho1)
[跟踪] 从 HDFS 下载工件时，将其存储在用户指定的目录中 (#5210, @DimaClaudiu)
[跟踪 / 模型注册] 提高大型工件和模型下载的性能 (#5359, @mehtayogita)
[模型] 修复 fast.ai PyFunc 对具有 2D 输出的模型的推理行为 (#5411, @santiagxf)
[模型] 调用 mlflow.spark.log_model() 时，将 Spark 模型信息记录到活动运行中 (#5355, @szczeles)
[模型] 使用 mlflow.pyfunc.load_model() 加载 ONNX 模型时，恢复 onnxruntime 执行提供程序 (#5317, @ecm200)
[项目] 使用 Projects with Docker 时，增加 Docker 镜像推送超时 (#5363, @zanitete)
[Python] 修复阻止用户启用 DEBUG 级别 Python 日志输出的错误 (#5362, @dbczumar)
[文档] 添加开发者指南，解释如何为 mlflow.evaluate() 构建自定义插件 (#5333, @WeichenXu123)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.23.1

2022年1月27日 ·阅读时长 1 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.23.1 版本发布！

MLflow 1.23.1 是一个包含以下错误修复的补丁版本

[模型] 修复加载 PySpark ML 模型时目录创建失败的问题 (#5299, @arjundc-db)
[模型注册] 恢复使用不区分大小写的验证逻辑处理 models:/ URI 中的阶段名称 (#5312, @lichenran1234)
[项目] 修复项目 tar 文件创建期间发生的竞争条件问题 (#5303, @dbczumar)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.23.0

2022年1月17日 ·阅读时长 2 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.23.0 版本发布！

MLflow 1.23.0 包含几个主要功能和改进

功能

[模型] 引入 mlflow.evaluate() API，用于评估 MLflow 模型，提供性能和可解释性洞察。有关概述，请参阅 https://mlflow.org.cn/docs/latest/models.html#model-evaluation (#5069, #5092, #5256, @WeichenXu123)
[模型] log_model() API 现在返回有关已记录 MLflow 模型的信息，包括工件位置、Flavor 和模式 (#5230, @liangz1)
[模型] 引入 mlflow.models.Model.load_input_example() Python API，用于加载 MLflow 模型输入示例 (#5212, @maitre-matt)
[模型] 向 MLflow 模型规范添加 UUID 字段。MLflow 模型现在具有唯一标识符 (#5149, #5167, @WeichenXu123)
[模型] 支持将 SciPy CSC 和 CSR 矩阵作为 MLflow 模型输入示例传递 (#5016, @WeichenXu123)
[模型注册] 支持在模型 URI 中指定 latest 以获取模型的最新版本，无论阶段如何 (#5027, @lichenran1234)
[跟踪] 向 mlflow.lightgbm.autolog() 添加对 LightGBM scikit-learn 模型的支持 (#5130, #5200, #5271 @jwyyy)
[跟踪] 通过缓存 boto 客户端提高 S3 工件下载速度 (#4695, @Samreay)
[UI] 自动更新进行中运行的指标图 (#5017, @cedkoffeto, @harupy)

错误修复和文档更新

[模型] 修复 MLflow 模型模式强制中的一个错误，其中字符串被错误地转换为 Pandas 对象 (#5134, @stevenchen-db)
[模型] 修复将关键字参数传递给 mlflow.pytorch.load_model() 时，这些参数未应用于脚本化模型的错误 (#5163, @schmidt-jake)
[模型注册][R] 修复 R 客户端 mlflow_create_model_version() API 中导致模型 source 设置不正确的错误 (#5185, @bramrodenburg)
[项目] 修复包含引号的项目 URI 的解析行为 (#5117, @dinaldoap)
[评分] 对格式错误的 MLflow 模型服务器请求使用正确的 400 级别错误代码 (#5003, @abatomunkuev)
[跟踪] 修复 mlflow.start_run() 修改用户提供的 tags 字典的错误 (#5191, @matheusMoreno)
[UI] 修复导致实验页面显示冗余滚动条的错误 (#5159, @sunishsheth2009)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.22.0

2021年11月29日 ·阅读时长 2 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.22.0 版本发布！

MLflow 1.22.0 包含几个主要功能和改进

功能

[UI] 在实验页面添加分享按钮 (#4936, @marijncv)
[UI] 改进实验页面列排序下拉菜单的可读性 (#5022, @WeichenXu123; #5018, @NieuweNils, @coder-freestyle)
[跟踪] 通过移除 @experimental 装饰器，将所有自动日志记录集成标记为稳定 (#5028, @liangz1)
[跟踪] 向 mlflow.set_experiment() 添加可选的 experiment_id 参数 (#5012, @dbczumar)
[跟踪] 向 mlflow.xgboost.autolog() 添加对 XGBoost scikit-learn 模型的支持 (#5078, @jwyyy)
[跟踪] 通过删除不必要的指标提高 statsmodels 自动日志记录性能 (#4942, @WeichenXu123)
[跟踪] 更新 R 客户端，用父运行 ID 标记嵌套运行 (#4197, @yitao-li)
[模型] 支持保存和加载所有 XGBoost 模型类型 (#4954, @jwyyy)
[评分] 将模型部署到 SageMaker 时，支持指定 AWS 账户和角色 (#4923, @andresionek91)
[评分] 支持使用 MLServer 提供 MLflow 模型服务 (#4963, @adriangonz)

错误修复和文档更新

[UI] 修复指标值过大导致指标图页面崩溃的错误 (#4947, @ianshan0915)
[UI] 修复平行坐标曲线消失的错误 (#5087, @harupy)
[UI] 如果用户信息缺失，则从模型版本页面移除创建者字段 (#5089, @jinzhang21)
[UI] 修复工件查看器中非 pyfunc 模型的模型加载说明 (#5006, @harupy)
[模型] 修复即使已存在哈希版本也会将 mlflow 添加到 conda.yaml 的错误 (#5058, @maitre-matt)
[文档] 添加关于指标、参数和标签键/值长度限制的 Python 文档 (#4991, @westford14)
[示例] 更新 Prophet 示例中使用的 Python 版本以修复安装错误 (#5101, @BenWilson2)
[示例] 修复 MLflow Projects + Kubernetes 示例中的 Kubernetes 资源规范 (#4948, @jianyuan)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.21.0

2021年10月25日 ·阅读时长 3 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.21.0 版本发布！

MLflow 1.21.0 包含几个主要功能和改进

功能

[UI] 在运行表格中添加“仅显示差异”切换，用于过滤掉具有常量值的列 (#4862, @marijncv)
[UI] 在运行表格中添加持续时间列 (#4840, @marijncv)
[UI] 在运行表格中显示默认的列排序顺序 (#4847, @marijncv)
[UI] 向导出的运行 CSV 添加开始时间和持续时间信息 (#4851, @marijncv)
[UI] 向运行页面添加生命周期阶段信息 (#4848, @marijncv)
[UI] 默认折叠运行页面部分以提高空间效率，将工件预览限制为 50MB (#4917, @dbczumar)
[跟踪] 引入 PaddlePaddle 模型训练的自动日志记录功能 (#4751, @jinminhao)
[跟踪] 向 CreateExperiment API 添加可选的 tags 字段 (#4788, @dbczumar; #4795, @apurva-koti)
[跟踪] 添加通过 mlflow gc CLI 从 SFTP 存储删除工件的支持 (#4670, @afaul)
[跟踪] 支持使用 AzureDefaultCredential 进行 Azure 工件存储后端身份验证 (#4002, @marijncv)
[模型] 升级 fastai 模型 Flavor 以支持 fastai V2 (>=2.4.1) (#4715, @jinzhang21)
[模型] 为 Prophet 时间序列模型引入 mlflow.prophet 模型 Flavor (#4773, @BenWilson2)
[模型] 引入用于将 MLflow 模型发布到 SageMaker 模型注册的 CLI (#4669, @jinnig)
[模型] 当推断的模型依赖项在 PyPI 上不可用时，打印警告 (#4891, @dbczumar)
[模型, 项目] 添加 MLFLOW_CONDA_CREATE_ENV_CMD 用于自定义 Conda 环境创建 (#4746, @giacomov)

错误修复和文档更新

[UI] 修复在运行表格中进行的列选择在实验之间持久化的问题 (#4926, @sunishsheth2009)
[UI] 修复运行表格列排序下拉菜单中显示文本“null”的问题 (#4924, @harupy)
[UI] 修复单击时指标图视图显示 NaN 值的错误 (#4858, @arpitjasa-db)
[跟踪] 修复在 UNIX 系统上路径包含空格或特殊字符导致模型加载失败的问题 (#4890, @BenWilson2)
[跟踪] 纠正影响 MLflow Tracking 与 SQL Server 一起使用的迁移问题 (#4880, @marijncv)
[跟踪] Spark 数据源自动日志记录标签现在遵守 MLflow Tracking 的最大允许大小 (#4809, @dbczumar)
[模型注册] 为模型注册 REST API 请求添加先前缺失的证书源 (#4731, @ericgosno91)
[模型注册] 当用户为 Databricks 提供无效的模型注册 URI 时抛出异常 (#4877, @yunpark93)
[评分] 修复将日期类字符串错误地转换为 datetime 对象的模式强制错误 (#4902, @wentinghu)
[文档] 扩展 MLflow Skinny Client 的文档 (#4113, @eedeleon)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.20.2

2021年9月3日 ·阅读时长 1 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.20.2 版本发布！

MLflow 1.20.2 是一个包含以下功能和错误修复的补丁版本

功能

在自动日志记录中为 Spark Flavor 启用自动依赖推断 (#4759, @harupy)

错误修复和文档更新

将 MLflow 客户端 HTTP 请求超时从 10 秒增加到 120 秒 (#4764, @jinzhang21)
修复与 TensorFlow 和 Keras 2.6.0 版本的自动日志记录兼容性错误 (#4766, @dbczumar)
小的错误修复和文档更新 (#4770, @WeichenXu123)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.20.0

2021年8月26日 ·阅读时长 2 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.20.0 版本发布！

注意：MLflow 1.20.0 的 R Package 尚未发布，但将在大约一周内发布，因为 CRAN 的提交系统将离线到 9 月 1 日。

除了错误和文档修复外，MLflow 1.20.0 还包含以下功能和改进

scikit-learn 的自动日志记录现在会在调用 scikit-learn 评估 API（例如 sklearn.metrics.mean_squared_error）时记录训练后指标 (#4491, #4628 #4638, @WeichenXu123)
PySpark ML 的自动日志记录现在会在调用模型评估 API（例如 Evaluator.evaluate()）时记录训练后指标 (#4686, @WeichenXu123)
为 mlflow.*.log_model 和 mlflow.*.save_model 添加 pip_requirements 和 extra_pip_requirements，用于直接指定要记录/保存的模型的 pip 要求 (#4519, #4577, #4602, @harupy)
在 PySpark CrossValidator 自动日志记录期间记录的训练指标中添加 stdMetrics 条目 (#4672, @WeichenXu123)
MLflow UI 更新
1. 改进了用于运行性能比较的平行坐标图的可扩展性，
2. 在实验页面添加了根据运行开始时间过滤运行的支持，
3. 在实验页面添加了运行表格列排序的下拉菜单，
4. 将用于在实验页面加载运行表格的 AG Grid 插件升级到 25.0.0 版本，
5. 修复了实验页面上的一个错误，该错误导致在选择其他表格部分的列时，运行表格的指标部分折叠 (#4712, @dbczumar)
为 PyTorch Lightning 的自动日志记录添加了分布式执行支持 (#4717, @dbczumar)
扩展了 R 对模型注册功能的支持 (#4527, @bramrodenburg)
添加了模型评分服务器支持，用于定义自定义预测响应包装器 (#4611, @Ark-kun)
mlflow.*.log_model 和 mlflow.*.save_model 现在会根据当前软件环境自动推断要记录/保存的模型的 pip 要求 (#4518, @harupy)
引入了使用 MLflow 模型运行 SageMaker Batch Transform 作业的支持 (#4410, #4589, @YQ-Wang)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。

MLflow 1.20.1

2021年8月26日 ·阅读时长 1 分钟

MLflow 维护者

我们很高兴宣布 MLflow 1.20.1 版本发布！

MLflow 1.20.1 是一个包含以下错误修复的补丁版本

避免在导入 mlflow.utils.requirements_utils 时调用 importlib_metadata.packages_distributions (#4741, @dbczumar)
避免依赖于 importlib_metadata==4.7.0 (#4740, @dbczumar)

有关更改的完整列表，请参阅发布变更日志，并查看 mlflow.org 上的最新文档。