跳到主要内容

MLflow 2.1.0

·阅读时长 3 分钟
MLflow maintainers

我们很高兴宣布 MLflow 2.1.0 已发布!

MLflow 2.1.0 包含几个主要功能和改进

功能

  • [Recipes] 引入对多分类的支持 (#7458, @mshtelma)
  • [Recipes] 扩展分类模型的 pyfunc 表示,使其除标签外还能输出分数 (#7474, @sunishsheth2009)
  • [UI] 在运行页面添加用户 ID 和生命周期阶段快速搜索链接 (#7462, @jaeday)
  • [Tracking] 对 GetMetricHistory API 进行分页 (#7523, #7415, @BenWilson2)
  • [Tracking] 添加与 UI 列名相对应的运行名称和开始时间的运行搜索别名 (#7492, @apurva-koti)
  • [Tracking] 为 mlflow server 添加 /version 端点,用于查询服务器的 MLflow 版本 (#7273, @joncarter1)
  • [Model Registry] 为模型注册表添加 FileStore 支持 (#6605, @serena-ruan)
  • [Model Registry] 引入 mlflow.search_registered_models() fluent API (#7428, @TSienki)
  • [Model Registry / Java] 为 Java 客户端添加 getRegisteredModel() 方法 (#6602) (#7511, @drod331)
  • [Model Registry / R] 为 R 客户端添加 mlflow_set_model_version_tag() 方法 (#7401, @leeweijie)
  • [Models] 在 MLmodel 规范和 log_model() 方法中引入 metadata 字段 (#7237, @jdonzallaz)
  • [Models] 扩展 Model.load() 以支持从远程位置加载 MLmodel 规范 (#7517, @dbczumar)
  • [Models] 在 Models 的 requirements.txtconda.yaml 文件中固定 MLflow 的主版本 (#7364, @BenWilson2)
  • [Scoring] 扩展 mlflow.pyfunc.spark_udf() 以支持 StructType 结果 (#7527, @WeichenXu123)
  • [Scoring] 扩展 TensorFlow 和 Keras 模型以支持 mlflow.pyfunc.spark_udf() 的多维输入 (#7531, #7291, @WeichenXu123)
  • [Scoring] 支持在将模型部署到 SageMaker 时指定部署环境变量和标签 (#7433, @jhallard)

错误修复

  • [Recipes] 修复了在模型调优期间阻止使用自定义 early_stop 函数的错误 (#7538, @sunishsheth2009)
  • [Recipes] 修复了数据摄取期间用于创建 Spark 会话的逻辑中的错误 (#7307, @WeichenXu123)
  • [Tracking] 使 mlflow.autolog() 生成的指标名称与 mlflow.evaluate() 保持一致 (#7418, @wenfeiy-db)
  • [Tracking] 修复了导致 XGBoost 和 LightGBM 模型记录嵌套、冗余信息的自动日志记录错误 (#7404, @WeichenXu123)
  • [Tracking] 正确地将 SQLAlchemy OperationalErrors 分类为可重试的 HTTP 错误 (#7240, @barrywhart)
  • [Artifacts] 在使用 FTP Artifact 存储时,正确处理凭据中的特殊字符 (#7479, @HCTsai)
  • [Models] 解决了阻止 MLeap 模型在 Windows 上保存的问题 (#6966, @dbczumar)
  • [Scoring] 修复了在使用 mlflow.pyfunc.spark_udf() 进行模型评分时使用 NFS 遇到的权限问题 (#7427, @WeichenXu123)

文档更新

  • [Docs] 为运行搜索文档页面添加更多示例 (#7487, @apurva-koti)
  • [Docs] 添加社区开发的模型 flavors 的文档 (#7425, @mmerce)
  • [Docs] 添加记录和评分 ONNX 模型的示例 (#7398, @Rusteam)
  • [Docs] 修复模型评分 REST API 示例中 dataframe_split 格式输入的拼写错误 (#7540, @zhouyangyu)
  • [Docs] 修复模型评分 REST API 示例中 dataframe_records 格式输入的拼写错误 (#7361, @dbczumar)

有关更改的完整列表,请参阅版本更改日志,并在mlflow.org上查看最新文档。