跳到主要内容

·阅读时长 1 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.26.1 版本发布!

MLflow 1.26.1 是一个包含以下错误修复的补丁版本

  • [安装] 修复与 protobuf >= 4.21.0 的兼容性问题 (#5945, @harupy)
  • [模型] 修复 get_model_dependencies 对包含工件路径的 models: URI 的行为 (#5921, @harupy)
  • [模型] 恢复 MLflow 1.25.0 中引入的、对 mlflow.pyfunc.log_model() 中工件持久性的一个有问题更改 (#5891, @kyle-jarvis)
  • [模型] 当 mlflow.evaluate()EvaluationArtifact 输出被垃圾回收时,关闭相关的图像文件 (#5900, @WeichenXu123)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。

·阅读时长 3 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.26.0 版本发布!

MLflow 1.26.0 包含几个主要功能和改进

功能

  • [CLI] 向部署 CLI 添加端点命名和选项配置 (#5731, @trangevi)
  • [构建,文档] 为 Linux 和 MacOS x86 操作系统添加开发环境设置脚本 (#5717, @BenWilson2)
  • [跟踪] 更新 mlflow.set_tracking_uri 以支持除了现有 str 路径声明之外、定义为 pathlib.Path 的路径 (#5824, @cacharle)
  • [评分] 向评分服务器 CLI 添加自定义超时覆盖选项以支持高延迟模型 (#5663, @sniafas)
  • [UI] 在实验运行列表表格中添加粘性表头,以便在滚动超出页面首屏时支持列名可见性 (#5818, @hubertzub-db)
  • [工件] 添加 GCS 对 MLflow 垃圾收集的支持 (#5811, @aditya-iyengar-rtl-de)
  • [评估] 为 eval_and_log_metrics API 添加 pos_label 参数,以支持准确的二元分类器评估指标 (#5807, @yxiong)
  • [UI] 在指标显示页面上添加最新、最小值和最大值指标字段 (#5574, @adamreeve)
  • [模型] 使用自动日志记录时,为 PySpark ML Flavor 添加 input_examplesignature 日志记录支持 (#5719, @bali0019)
  • [模型] 为 mlflow models docker-build CLI 添加 virtualenv 环境管理器支持 (#5728, @harupy)
  • [模型] 为 PySpark 模型在 log_model_allowlist 中添加通配符模块匹配支持 (#5723, @serena-ruan)
  • [项目] 为 MLflow 项目添加 virtualenv 环境管理器支持 (#5631, @harupy)
  • [模型] 为 MLflow 模型添加 virtualenv 环境管理器支持 (#5380, @harupy)
  • [模型] 为 mlflow.pyfunc.spark_udf 添加 virtualenv 环境管理器支持 (#5676, @WeichenXu123)
  • [模型] 使用自动日志记录时,为 TensorFlow Flavor 添加 input_examplesignature 日志记录支持 (#5510, @bali0019)
  • [服务器基础设施] 添加 JSON Schema 类型验证,以便对 REST API 端点的格式错误请求引发 400 错误 (#5458, @mrkaye97)
  • [评分] 为 MLflow 部署引入抽象端点接口 (#5378, @trangevi)
  • [UI] 在运行比较页面添加“结束时间”和“持续时间”字段 (#3378, @RealArpanBhattacharya)
  • [Serving] 为模型 Serving 解析输入 CSV 数据时添加模式验证支持 (#5531, @vvijay-bolt)

错误修复和文档更新

  • [模型] 修复 Spark 数据源中 REPL ID 从数据源监听器传播到发布器的问题 (#5826, @dbczumar)
  • [UI] 更新 ag-grid 并实现 getRowId 以改进运行表格可视化的性能 (#5725, @adamreeve)
  • [Serving] 修复 tf-serving 解析以支持基于列的格式 (#5825, @arjundc-db)
  • [工件] 更新 log_artifact 以支持 HDFS 中大于 2GB 的模型 (#5812, @hitchhicker)
  • [模型] 修复自动日志记录以支持名称中包含“@”符号的 LightGBM 指标名称 (#5785, @mengchendd)
  • [模型] Pyfunc: 修复子目录的代码目录解析 (#5806, @dbczumar)
  • [服务器基础设施] 修复 mlflow-R 服务器在 Windows 上启动失败的问题 (#5767, @serena-ruan)
  • [文档] 添加关于 virtualenv 环境管理器支持 MLflow 项目的文档 (#5727, @harupy)
  • [UI] 修复工件显示尺寸,以支持在预览窗格中全宽渲染 (#5606, @szczeles)
  • [模型] 通过将驱动程序地址绑定到 localhost 来修复加载 Spark 模型时的本地主机名问题 (#5753, @WeichenXu123)
  • [模型] 修复 TensorFlow Flavor 的自动日志记录验证和 batch_size 计算 (#5683, @MarkYHZhang)
  • [工件] 修复 SqlAlchemyStore.log_batch 实现,使其能够批量记录数据 (#5460, @erensahin)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。

·阅读时长 2 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.24.0 版本发布!

MLflow 1.24.0 包含几个主要功能和改进

功能

  • [跟踪] 通过 mlflow server --serve-artifacts 支持通过 MLflow 服务器上传、下载和列出工件 (#5320, @BenWilson2, @harupy)
  • [跟踪] 为 mlflow.autolog() 添加 registered_model_name 参数,以便在自动日志记录期间进行自动模型注册 (#5395, @WeichenXu123)
  • [UI] 改进并重构运行比较页面。新增内容包括“仅显示差异”切换和可滚动表格 (#5306, @WeichenXu123)
  • [模型] 为 pmdarima 模型引入 mlflow.pmdarima Flavor (#5373, @BenWilson2)
  • [模型] 加载 MLflow 模型时,如果检测到当前环境与模型依赖项不匹配,则打印警告 (#5368, @WeichenXu123)
  • [模型] 支持使用 mlflow.evaluate() 在模型评估期间计算自定义标量指标 (#5389, @MarkYHZhang)
  • [评分] 添加通过 MLflow 部署 API <https://mlflow.org.cn/docs/latest/models.html#deployment-to-custom-targets>_ 部署和评估 SageMaker 模型的支持 (#4971, #5396, @jamestran201)

错误修复和文档更新

  • [跟踪 / UI] 修复在 --serve-artifacts 模式下运行 MLflow 服务器时发生的工件列表和下载失败 (#5409, @dbczumar)
  • [跟踪] 在 --serve-artifacts 模式下向 MLflow 服务器发出工件请求时,支持基于环境变量的身份验证 (#5370, @TimNooren)
  • [跟踪] 修复在 --serve-artifacts 模式下向 MLflow 服务器发出工件请求时发生的主机名和路径解析错误 (#5384, #5385, @mert-kirpici)
  • [跟踪] 修复在使用 mlflow.log_figure() 时未导入 matplotlib.figure 导致的导入错误 (#5406, @WeichenXu123)
  • [跟踪] 在自动日志记录期间正确记录包含“@”符号的 XGBoost 指标 (#5403, @maxfriedrich)
  • [跟踪] 修复在运行搜索期间发生的 SQL Server 数据库错误 (#5382, @dianacarvalho1)
  • [跟踪] 从 HDFS 下载工件时,将其存储在用户指定的目录中 (#5210, @DimaClaudiu)
  • [跟踪 / 模型注册] 提高大型工件和模型下载的性能 (#5359, @mehtayogita)
  • [模型] 修复 fast.ai PyFunc 对具有 2D 输出的模型的推理行为 (#5411, @santiagxf)
  • [模型] 调用 mlflow.spark.log_model() 时,将 Spark 模型信息记录到活动运行中 (#5355, @szczeles)
  • [模型] 使用 mlflow.pyfunc.load_model() 加载 ONNX 模型时,恢复 onnxruntime 执行提供程序 (#5317, @ecm200)
  • [项目] 使用 Projects with Docker 时,增加 Docker 镜像推送超时 (#5363, @zanitete)
  • [Python] 修复阻止用户启用 DEBUG 级别 Python 日志输出的错误 (#5362, @dbczumar)
  • [文档] 添加开发者指南,解释如何为 mlflow.evaluate() 构建自定义插件 (#5333, @WeichenXu123)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。

·阅读时长 1 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.23.1 版本发布!

MLflow 1.23.1 是一个包含以下错误修复的补丁版本

  • [模型] 修复加载 PySpark ML 模型时目录创建失败的问题 (#5299, @arjundc-db)
  • [模型注册] 恢复使用不区分大小写的验证逻辑处理 models:/ URI 中的阶段名称 (#5312, @lichenran1234)
  • [项目] 修复项目 tar 文件创建期间发生的竞争条件问题 (#5303, @dbczumar)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。

·阅读时长 2 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.23.0 版本发布!

MLflow 1.23.0 包含几个主要功能和改进

功能

错误修复和文档更新

  • [模型] 修复 MLflow 模型模式强制中的一个错误,其中字符串被错误地转换为 Pandas 对象 (#5134, @stevenchen-db)
  • [模型] 修复将关键字参数传递给 mlflow.pytorch.load_model() 时,这些参数未应用于脚本化模型的错误 (#5163, @schmidt-jake)
  • [模型注册][R] 修复 R 客户端 mlflow_create_model_version() API 中导致模型 source 设置不正确的错误 (#5185, @bramrodenburg)
  • [项目] 修复包含引号的项目 URI 的解析行为 (#5117, @dinaldoap)
  • [评分] 对格式错误的 MLflow 模型服务器请求使用正确的 400 级别错误代码 (#5003, @abatomunkuev)
  • [跟踪] 修复 mlflow.start_run() 修改用户提供的 tags 字典的错误 (#5191, @matheusMoreno)
  • [UI] 修复导致实验页面显示冗余滚动条的错误 (#5159, @sunishsheth2009)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。

·阅读时长 2 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.22.0 版本发布!

MLflow 1.22.0 包含几个主要功能和改进

功能

错误修复和文档更新

  • [UI] 修复指标值过大导致指标图页面崩溃的错误 (#4947, @ianshan0915)
  • [UI] 修复平行坐标曲线消失的错误 (#5087, @harupy)
  • [UI] 如果用户信息缺失,则从模型版本页面移除创建者字段 (#5089, @jinzhang21)
  • [UI] 修复工件查看器中非 pyfunc 模型的模型加载说明 (#5006, @harupy)
  • [模型] 修复即使已存在哈希版本也会将 mlflow 添加到 conda.yaml 的错误 (#5058, @maitre-matt)
  • [文档] 添加关于指标、参数和标签键/值长度限制的 Python 文档 (#4991, @westford14)
  • [示例] 更新 Prophet 示例中使用的 Python 版本以修复安装错误 (#5101, @BenWilson2)
  • [示例] 修复 MLflow Projects + Kubernetes 示例中的 Kubernetes 资源规范 (#4948, @jianyuan)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。

·阅读时长 3 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.21.0 版本发布!

MLflow 1.21.0 包含几个主要功能和改进

功能

  • [UI] 在运行表格中添加“仅显示差异”切换,用于过滤掉具有常量值的列 (#4862, @marijncv)
  • [UI] 在运行表格中添加持续时间列 (#4840, @marijncv)
  • [UI] 在运行表格中显示默认的列排序顺序 (#4847, @marijncv)
  • [UI] 向导出的运行 CSV 添加开始时间和持续时间信息 (#4851, @marijncv)
  • [UI] 向运行页面添加生命周期阶段信息 (#4848, @marijncv)
  • [UI] 默认折叠运行页面部分以提高空间效率,将工件预览限制为 50MB (#4917, @dbczumar)
  • [跟踪] 引入 PaddlePaddle 模型训练的自动日志记录功能 (#4751, @jinminhao)
  • [跟踪] 向 CreateExperiment API 添加可选的 tags 字段 (#4788, @dbczumar; #4795, @apurva-koti)
  • [跟踪] 添加通过 mlflow gc CLI 从 SFTP 存储删除工件的支持 (#4670, @afaul)
  • [跟踪] 支持使用 AzureDefaultCredential 进行 Azure 工件存储后端身份验证 (#4002, @marijncv)
  • [模型] 升级 fastai 模型 Flavor 以支持 fastai V2 (>=2.4.1) (#4715, @jinzhang21)
  • [模型] 为 Prophet 时间序列模型引入 mlflow.prophet 模型 Flavor (#4773, @BenWilson2)
  • [模型] 引入用于将 MLflow 模型发布到 SageMaker 模型注册的 CLI (#4669, @jinnig)
  • [模型] 当推断的模型依赖项在 PyPI 上不可用时,打印警告 (#4891, @dbczumar)
  • [模型, 项目] 添加 MLFLOW_CONDA_CREATE_ENV_CMD 用于自定义 Conda 环境创建 (#4746, @giacomov)

错误修复和文档更新

  • [UI] 修复在运行表格中进行的列选择在实验之间持久化的问题 (#4926, @sunishsheth2009)
  • [UI] 修复运行表格列排序下拉菜单中显示文本“null”的问题 (#4924, @harupy)
  • [UI] 修复单击时指标图视图显示 NaN 值的错误 (#4858, @arpitjasa-db)
  • [跟踪] 修复在 UNIX 系统上路径包含空格或特殊字符导致模型加载失败的问题 (#4890, @BenWilson2)
  • [跟踪] 纠正影响 MLflow Tracking 与 SQL Server 一起使用的迁移问题 (#4880, @marijncv)
  • [跟踪] Spark 数据源自动日志记录标签现在遵守 MLflow Tracking 的最大允许大小 (#4809, @dbczumar)
  • [模型注册] 为模型注册 REST API 请求添加先前缺失的证书源 (#4731, @ericgosno91)
  • [模型注册] 当用户为 Databricks 提供无效的模型注册 URI 时抛出异常 (#4877, @yunpark93)
  • [评分] 修复将日期类字符串错误地转换为 datetime 对象的模式强制错误 (#4902, @wentinghu)
  • [文档] 扩展 MLflow Skinny Client 的文档 (#4113, @eedeleon)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。

·阅读时长 1 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.20.2 版本发布!

MLflow 1.20.2 是一个包含以下功能和错误修复的补丁版本

功能

  • 在自动日志记录中为 Spark Flavor 启用自动依赖推断 (#4759, @harupy)

错误修复和文档更新

  • 将 MLflow 客户端 HTTP 请求超时从 10 秒增加到 120 秒 (#4764, @jinzhang21)
  • 修复与 TensorFlow 和 Keras 2.6.0 版本的自动日志记录兼容性错误 (#4766, @dbczumar)
  • 小的错误修复和文档更新 (#4770, @WeichenXu123)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。

·阅读时长 2 分钟
MLflow maintainers

我们很高兴宣布 MLflow 1.20.0 版本发布!

注意:MLflow 1.20.0 的 R Package 尚未发布,但将在大约一周内发布,因为 CRAN 的提交系统将离线到 9 月 1 日。

除了错误和文档修复外,MLflow 1.20.0 还包含以下功能和改进

  • scikit-learn 的自动日志记录现在会在调用 scikit-learn 评估 API(例如 sklearn.metrics.mean_squared_error)时记录训练后指标 (#4491, #4628 #4638, @WeichenXu123)
  • PySpark ML 的自动日志记录现在会在调用模型评估 API(例如 Evaluator.evaluate())时记录训练后指标 (#4686, @WeichenXu123)
  • mlflow.*.log_modelmlflow.*.save_model 添加 pip_requirementsextra_pip_requirements,用于直接指定要记录/保存的模型的 pip 要求 (#4519, #4577, #4602, @harupy)
  • 在 PySpark CrossValidator 自动日志记录期间记录的训练指标中添加 stdMetrics 条目 (#4672, @WeichenXu123)
  • MLflow UI 更新
    1. 改进了用于运行性能比较的平行坐标图的可扩展性,
    2. 在实验页面添加了根据运行开始时间过滤运行的支持,
    3. 在实验页面添加了运行表格列排序的下拉菜单,
    4. 将用于在实验页面加载运行表格的 AG Grid 插件升级到 25.0.0 版本,
    5. 修复了实验页面上的一个错误,该错误导致在选择其他表格部分的列时,运行表格的指标部分折叠 (#4712, @dbczumar)
  • 为 PyTorch Lightning 的自动日志记录添加了分布式执行支持 (#4717, @dbczumar)
  • 扩展了 R 对模型注册功能的支持 (#4527, @bramrodenburg)
  • 添加了模型评分服务器支持,用于定义自定义预测响应包装器 (#4611, @Ark-kun)
  • mlflow.*.log_modelmlflow.*.save_model 现在会根据当前软件环境自动推断要记录/保存的模型的 pip 要求 (#4518, @harupy)
  • 引入了使用 MLflow 模型运行 SageMaker Batch Transform 作业的支持 (#4410, #4589, @YQ-Wang)

有关更改的完整列表,请参阅发布变更日志,并查看 mlflow.org 上的最新文档。