跳到主要内容

Jupyter Notebook 中的 MLflow 追踪

·3 分钟阅读
Daniel Lok
Databricks 软件工程师

Thumbnail

🚀 我们很高兴地宣布对 MLflow Tracing 体验进行了重大升级!

如果您不熟悉 MLflow Tracing,它是一个可观察性工具,允许您记录中间函数执行的输入和输出。它在调试 GenAI 应用程序方面特别有用,MLflow 拥有 十几个与流行的 GenAI 框架的集成,可以自动生成跟踪,而无需您更改现有代码。

MLflow 2.20 开始,您现在可以直接在 Jupyter Notebook 中查看 MLflow Trace UI,从而无需切换选项卡即可调试应用程序。上下文切换通常会干扰工作流程,而此功能使您在能够可视化所生成跟踪数据的情况下,更容易保持专注。

MLflow Trace UI in Jupyter Notebook

JupyterLab 中 UI 的示例

开始使用

要开始使用,您需要使用 MLflow Tracking Server。在底层,MLflow 客户端需要进行网络请求才能获取 UI 资源和跟踪数据。

如果您不使用远程服务器,您可以随时通过运行 mlflow server CLI 命令 在本地启动一个。默认情况下,服务器将在 https://:5000 启动。

在您的 Notebook 中,只需确保 MLflow Tracking URI 设置为您的跟踪服务器,即可开始!

import mlflow

# replace this with your own URI, if it differs
tracking_uri = "https://:5000"
mlflow.set_tracking_uri(tracking_uri)

# create a new experiment to avoid cluttering the default experiment
experiment = mlflow.set_experiment("mlflow-trace-ui-demo")

# the trace UI should now show up whenever traces are generated,
# for example:
@mlflow.trace
def add(a, b):
return a + b

# running the traced function triggers the UI display
add(1, 2)

每当发生以下任一事件时,跟踪 UI 就会显示

  1. 单元格中生成了跟踪(通过自动跟踪,或在运行手动跟踪的函数时)
  2. 显式显示跟踪对象时(例如,通过 IPython 的 display() 函数)
  3. 调用 mlflow.search_traces() API 时

为了获得此功能的实践体验,请尝试运行我们的 演示 Notebook!该 Notebook 包含上述所有三种场景的详细示例,以及一个简短的 LangChain RAG 演示,让您更真实地感受此功能在您的开发循环中的体验。

禁用和重新启用显示

此功能默认启用,但可以通过调用 mlflow.tracing.disable_notebook_display() 随时关闭。要删除已渲染的显示,您需要重新运行单元格(或简单地清除单元格输出)。

如果您想重新启用显示,可以调用 mlflow.tracing.enable_notebook_display()

错误报告和反馈

要报告错误或提供反馈,请在 MLflow GitHub 仓库 中提交一个 issue。我们期待您的回复!