mlflow.environment_variables
此模块定义了 MLflow 中使用的环境变量。MLflow 的环境变量遵循以下命名约定:- 公共变量:环境变量名称以 MLFLOW_ 开头 - 内部使用变量:仅供内部使用的变量,名称以 _MLFLOW_ 开头
- mlflow.environment_variables.MLFLOW_ACTIVE_MODEL_ID = 'MLFLOW_ACTIVE_MODEL_ID'
默认的活动 LoggedModel ID。在此变量设置期间创建的跟踪(除非被覆盖,例如通过 set_active_model() API)将与此 LoggedModel ID 关联。(默认值:
None)
- mlflow.environment_variables.MLFLOW_ALIAS_PROMPT_CACHE_TTL_SECONDS = 'MLFLOW_ALIAS_PROMPT_CACHE_TTL_SECONDS'
在提示缓存中,例如“prompts /name@latest”。超过此时间后,缓存的提示将被视为过时,并在下次访问时刷新。设置为 0 以完全禁用缓存。(默认值:
60)- 类型
基于别名的缓存提示的生存时间(以秒为单位),例如“prompts
- mlflow.environment_variables.MLFLOW_ALLOW_HTTP_REDIRECTS = 'MLFLOW_ALLOW_HTTP_REDIRECTS'
指定 MLflow 服务器在发出 HTTP 请求时是否允许遵循重定向。如果设置为 False,服务器遇到重定向响应时将抛出异常。(默认值:
True)
- mlflow.environment_variables.MLFLOW_ALLOW_PICKLE_DESERIALIZATION = 'MLFLOW_ALLOW_PICKLE_DESERIALIZATION'
指定是否允许对模型加载进行不安全的 pickle 反序列化
- mlflow.environment_variables.MLFLOW_ARTIFACT_LOCATION_MAX_LENGTH = 'MLFLOW_ARTIFACT_LOCATION_MAX_LENGTH'
指定实验的工件位置的最大长度(以字符为单位)。默认为 2048。
- mlflow.environment_variables.MLFLOW_ARTIFACT_UPLOAD_DOWNLOAD_TIMEOUT = 'MLFLOW_ARTIFACT_UPLOAD_DOWNLOAD_TIMEOUT'
(实验性,可能会更改或删除)指定上传或下载文件时使用的超时时间(默认值:
None)。如果为 None,各个工件存储将选择默认值。
- mlflow.environment_variables.MLFLOW_ASYNC_LOGGING_BUFFERING_SECONDS = 'MLFLOW_ASYNC_LOGGING_BUFFERING_SECONDS'
指定异步日志记录线程等待多长时间(以秒为单位)才记录一批数据。
- mlflow.environment_variables.MLFLOW_ASYNC_LOGGING_THREADPOOL_SIZE = 'MLFLOW_ASYNC_LOGGING_THREADPOOL_SIZE'
用于异步日志记录的线程池中的工作线程数,默认为 10。
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_MAX_INTERVAL_MILLIS = 'MLFLOW_ASYNC_TRACE_LOGGING_MAX_INTERVAL_MILLIS'
两次批处理之间的最大间隔(以毫秒为单位)。达到此间隔时,MLflow 将导出当前批次中的 span,而不管批次大小如何。此间隔仅在最大批次大小设置为大于 1 时适用。注意:目前只有 Unity Catalog 表导出器支持批处理。其他导出器将立即导出 span。(默认值:
5000= 5 秒)
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_MAX_QUEUE_SIZE = 'MLFLOW_ASYNC_TRACE_LOGGING_MAX_QUEUE_SIZE'
异步跟踪日志记录要排队的导出任务的最大数量。当队列已满时,新的导出任务将被丢弃。(默认值:
1000)
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_MAX_SPAN_BATCH_SIZE = 'MLFLOW_ASYNC_TRACE_LOGGING_MAX_SPAN_BATCH_SIZE'
在单个批次中导出的 span 的最大数量。当设置为大于 1 时,MLflow 将分批导出 span。这必须与将 MLFLOW_ENABLE_ASYNC_TRACE_LOGGING 设置为 true(默认)一起使用。注意:目前只有 Unity Catalog 表导出器支持批处理。其他导出器将立即导出 span。(默认值:
1= 不进行批处理)
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_MAX_WORKERS = 'MLFLOW_ASYNC_TRACE_LOGGING_MAX_WORKERS'
用于异步跟踪日志记录的最大工作线程数。(默认值:
10)
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_RETRY_TIMEOUT = 'MLFLOW_ASYNC_TRACE_LOGGING_RETRY_TIMEOUT'
跟踪日志记录重试的超时时间(秒)。(默认值:
500)
- mlflow.environment_variables.MLFLOW_AUTH_CONFIG_PATH = 'MLFLOW_AUTH_CONFIG_PATH'
指定 MLflow 身份验证的配置文件路径。(默认值:
None)
- mlflow.environment_variables.MLFLOW_CONDA_CREATE_ENV_CMD = 'MLFLOW_CONDA_CREATE_ENV_CMD'
指定创建环境时使用的命令名称。例如,假设我们想使用 mamba(https://github.com/mamba-org/mamba)而不是 conda 来创建环境。然后:> conda install mamba -n base -c conda-forge 如果未设置,则使用与 conda_path 相同的值(默认值:
conda)
- mlflow.environment_variables.MLFLOW_CONFIGURE_LOGGING = 'MLFLOW_CONFIGURE_LOGGING'
指定在导入时是否让 mlflow 配置日志记录。如果设置为 True,mlflow 将使用日志处理程序和格式化程序配置
mlflow.<module_name>日志记录器。(默认值:True)
- mlflow.environment_variables.MLFLOW_CREATE_MODEL_VERSION_SOURCE_VALIDATION_REGEX = 'MLFLOW_CREATE_MODEL_VERSION_SOURCE_VALIDATION_REGEX'
如果指定,跟踪服务器将拒绝源不与指定的正则表达式匹配的模型 /mlflow/model-versions/create 请求。(默认值:
None)。
- mlflow.environment_variables.MLFLOW_DATABRICKS_ENDPOINT_HTTP_RETRY_TIMEOUT = 'MLFLOW_DATABRICKS_ENDPOINT_HTTP_RETRY_TIMEOUT'
指定 Databricks 端点 HTTP 请求重试的超时时间(秒)。
- mlflow.environment_variables.MLFLOW_DEFAULT_PREDICTION_DEVICE = 'MLFLOW_DEFAULT_PREDICTION_DEVICE'
指定用于 predict 函数(预测函数)的设备——可以通过将此环境变量设置为
cpu来覆盖默认使用 GPU(如果可用)的行为。目前,此变量仅支持 MLflow PyTorch 和 HuggingFace 风格。对于 HuggingFace 风格,请注意 device 必须可以解析为整数。
- mlflow.environment_variables.MLFLOW_DEPLOYMENTS_CONFIG = 'MLFLOW_DEPLOYMENTS_CONFIG'
指定 MLflow AI Gateway 的配置文件路径。(默认值:
None)
- mlflow.environment_variables.MLFLOW_DEPLOYMENTS_TARGET = 'MLFLOW_DEPLOYMENTS_TARGET'
(实验性,可能会更改或删除)指定将与部署客户端 API 一起使用的 MLflow AI Gateway 实例的 URI(默认值:
None)
- mlflow.environment_variables.MLFLOW_DEPLOYMENT_CLIENT_HTTP_REQUEST_TIMEOUT = 'MLFLOW_DEPLOYMENT_CLIENT_HTTP_REQUEST_TIMEOUT'
指定 MLflow 部署客户端 HTTP 请求(非预测操作)的超时时间(秒)。这与 MLFLOW_HTTP_REQUEST_TIMEOUT 分开,以允许对 LLM 调用设置更长的超时时间(默认值:
300)
- mlflow.environment_variables.MLFLOW_DEPLOYMENT_FLAVOR_NAME = 'MLFLOW_DEPLOYMENT_FLAVOR_NAME'
指定在评分服务器中提供的风格。(默认
None)
- mlflow.environment_variables.MLFLOW_DEPLOYMENT_PREDICT_TIMEOUT = 'MLFLOW_DEPLOYMENT_PREDICT_TIMEOUT'
单个 HTTP 请求到部署端点的超时时间(秒)。这控制着一次单独的 predict/predict_stream 请求可以运行多长时间后超时。如果您的模型推理时间更长(例如,需要几分钟的长期代理查询),则必须增加此值以允许单个请求完成。例如,如果您的最长查询需要 5 分钟,请将此值至少设置为 300 秒。在 predict 和 predict_stream API 中使用。(默认值:
120)
- mlflow.environment_variables.MLFLOW_DEPLOYMENT_PREDICT_TOTAL_TIMEOUT = 'MLFLOW_DEPLOYMENT_PREDICT_TOTAL_TIMEOUT'
所有重试尝试总共的时间限制(秒)。这控制着客户端在完全放弃之前将继续重试失败的请求的总时间。这与 MLFLOW_DEPLOYMENT_PREDICT_TIMEOUT 不同,后者控制单个请求可以运行多长时间,而此变量控制所有重试的总时间。对于可能遇到瞬时故障的长时间运行操作,请确保同时适当地设置这两个超时。此值应大于或等于 MLFLOW_DEPLOYMENT_PREDICT_TIMEOUT。(默认值:
600)
- mlflow.environment_variables.MLFLOW_DFS_TMP = 'MLFLOW_DFS_TMP'
为
mlflow.spark.save_model、mlflow.spark.log_model和mlflow.spark.load_model指定要使用的dfs_tmpdir参数。有关更多信息,请参阅 https://www.mlflow.org/docs/latest/python_api/mlflow.spark.html#mlflow.spark.save_model。(默认值:/tmp/mlflow)
- mlflow.environment_variables.MLFLOW_DISABLE_DATABRICKS_SDK_FOR_RUN_ARTIFACTS = 'MLFLOW_DISABLE_DATABRICKS_SDK_FOR_RUN_ARTIFACTS'
禁用用于运行工件的 Databricks SDK。我们默认启用此功能,因为在大多数情况下,我们希望对运行工件使用 Databricks SDK,但这为我们在需要时禁用它提供了一种方法。
- mlflow.environment_variables.MLFLOW_DISABLE_ENV_CREATION = 'MLFLOW_DISABLE_ENV_CREATION'
指定是否禁用为 mlflow models build-docker 创建新的 conda 环境。(默认值:
False)
- mlflow.environment_variables.MLFLOW_DISABLE_ENV_MANAGER_CONDA_WARNING = 'MLFLOW_DISABLE_ENV_MANAGER_CONDA_WARNING'
指定在指定 –env-manager=conda 时是否打印警告。(默认值:
False)
- mlflow.environment_variables.MLFLOW_DISABLE_SCHEMA_DETAILS = 'MLFLOW_DISABLE_SCHEMA_DETAILS'
是否禁用 MLflow 模式强制执行的错误消息中的架构详细信息。(默认值:
False)
- mlflow.environment_variables.MLFLOW_DISABLE_TELEMETRY = 'MLFLOW_DISABLE_TELEMETRY'
是否禁用 MLflow 中的遥测数据收集。如果设置为 True,则不会收集任何遥测数据。(默认值:
False)
- mlflow.environment_variables.MLFLOW_DOCKER_OPENJDK_VERSION = 'MLFLOW_DOCKER_OPENJDK_VERSION'
用于 MLflow 模型的 Docker 映像中安装的 OpenJDK 版本。(默认值:
11)
- mlflow.environment_variables.MLFLOW_DOWNLOAD_CHUNK_TIMEOUT = 'MLFLOW_DOWNLOAD_CHUNK_TIMEOUT'
指定下载 mlflow 工件块的超时值。(默认值:
300)
- mlflow.environment_variables.MLFLOW_ENABLE_ARTIFACTS_PROGRESS_BAR = 'MLFLOW_ENABLE_ARTIFACTS_PROGRESS_BAR'
指定上传/下载工件时是否显示进度条。(默认值:
True)
- mlflow.environment_variables.MLFLOW_ENABLE_ASYNC_LOGGING = 'MLFLOW_ENABLE_ASYNC_LOGGING'
如果为 True,MLflow fluent 日志记录 API,例如 mlflow.log_metric 将异步记录。
- mlflow.environment_variables.MLFLOW_ENABLE_ASYNC_TRACE_LOGGING = 'MLFLOW_ENABLE_ASYNC_TRACE_LOGGING'
指定是否启用异步跟踪日志记录到 Databricks 跟踪服务器。TODO:将 OSS MLflow Server 更新为默认异步日志记录 默认值:
True。
- mlflow.environment_variables.MLFLOW_ENABLE_DBFS_FUSE_ARTIFACT_REPO = 'MLFLOW_ENABLE_DBFS_FUSE_ARTIFACT_REPO'
指定在 Databricks 上存储工件时是否使用 DBFS FUSE 挂载(默认值:
False)
- mlflow.environment_variables.MLFLOW_ENABLE_DB_SDK = 'MLFLOW_ENABLE_DB_SDK'
是否启用 Databricks SDK。如果为 true,MLflow 使用 databricks-sdk 向 Databricks 端点发送 HTTP 请求,否则 MLflow 使用
requests库向 Databricks 端点发送 HTTP 请求。请注意,如果要使用 OAuth 身份验证,则必须将此环境变量设置为 true。(默认值:True)
- mlflow.environment_variables.MLFLOW_ENABLE_OTLP_EXPORTER = 'MLFLOW_ENABLE_OTLP_EXPORTER'
控制当设置 OTEL_EXPORTER_OTLP_TRACES_ENDPOINT 时,MLflow 是否应将跟踪导出到 OTLP 端点。这允许用户即使在为其他遥测客户端配置了 OTEL 端点时禁用 MLflow 的 OTLP 导出。(默认值:
True)
- mlflow.environment_variables.MLFLOW_ENABLE_PROXY_MULTIPART_UPLOAD = 'MLFLOW_ENABLE_PROXY_MULTIPART_UPLOAD'
指定是否使用 multipart 上传来进行代理的工件访问。(默认值:
False)
- mlflow.environment_variables.MLFLOW_ENABLE_SYSTEM_METRICS_LOGGING = 'MLFLOW_ENABLE_SYSTEM_METRICS_LOGGING'
指定是否启用系统指标日志记录。
- mlflow.environment_variables.MLFLOW_ENABLE_UC_FUNCTIONS = 'MLFLOW_ENABLE_UC_FUNCTIONS'
(已弃用)启用 MLflow AI Gateway 的 Unity Catalog 集成。此功能已弃用,将在未来的版本中删除。(默认值:
False)
- mlflow.environment_variables.MLFLOW_ENABLE_UC_VOLUME_FUSE_ARTIFACT_REPO = 'MLFLOW_ENABLE_UC_VOLUME_FUSE_ARTIFACT_REPO'
指定在 Databricks 上存储工件时是否使用 UC Volume FUSE 挂载(默认值:
True)
- mlflow.environment_variables.MLFLOW_ENFORCE_STDIN_SCORING_SERVER_FOR_SPARK_UDF = 'MLFLOW_ENFORCE_STDIN_SCORING_SERVER_FOR_SPARK_UDF'
指定是否强制在 Spark udf 中使用 stdin 评分服务器。(默认值:
True)
- mlflow.environment_variables.MLFLOW_ENV_ROOT = 'MLFLOW_ENV_ROOT'
指定创建 Python 虚拟环境的根目录。(默认值:
~/.mlflow/envs)
- mlflow.environment_variables.MLFLOW_EXPERIMENT_ID = 'MLFLOW_EXPERIMENT_ID'
指定创建运行的默认实验 ID。(默认值:
None)
- mlflow.environment_variables.MLFLOW_EXPERIMENT_NAME = 'MLFLOW_EXPERIMENT_NAME'
指定创建运行的默认实验名称。(默认值:
None)
- mlflow.environment_variables.MLFLOW_FLASK_SERVER_SECRET_KEY = 'MLFLOW_FLASK_SERVER_SECRET_KEY'
Flask 应用程序的密钥。在启用基本身份验证的情况下运行应用程序时,启用 UI 注册页面中的 CSRF 保护需要此密钥
- mlflow.environment_variables.MLFLOW_GATEWAY_CONFIG = 'MLFLOW_GATEWAY_CONFIG'
指定 MLflow AI Gateway 的配置文件路径。(默认值:
None)
- mlflow.environment_variables.MLFLOW_GATEWAY_URI = 'MLFLOW_GATEWAY_URI'
(实验性,可能会更改或删除)指定将与网关客户端 API 一起使用的 MLflow 网关服务器实例的 URI(默认值:
None)
- mlflow.environment_variables.MLFLOW_GCS_DOWNLOAD_CHUNK_SIZE = 'MLFLOW_GCS_DOWNLOAD_CHUNK_SIZE'
指定从 GCS 下载文件时使用的块大小(默认值:
None)。如果为 None,则块大小由google-cloud-storage包自动确定。
- mlflow.environment_variables.MLFLOW_GCS_UPLOAD_CHUNK_SIZE = 'MLFLOW_GCS_UPLOAD_CHUNK_SIZE'
指定将文件上传到 GCS 时使用的块大小。(默认值:
None)。如果为 None,则块大小由google-cloud-storage包自动确定。
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_ASYNC_TIMEOUT = 'MLFLOW_GENAI_EVAL_ASYNC_TIMEOUT'
mlflow.genai.evaluate 中异步预测函数的超时时间(秒)。当将异步函数作为 predict_fn 传递时,它将使用此超时时间通过 asyncio.run() 包装。 (默认值:
300)
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_ENABLE_SCORER_TRACING = 'MLFLOW_GENAI_EVAL_ENABLE_SCORER_TRACING'
启用评估评分器的跟踪。默认情况下(False),MLflow 不会跟踪评分器函数调用。要跟踪评分器函数以进行调试,请将此设置为 True。
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_MAX_SCORER_WORKERS = 'MLFLOW_GENAI_EVAL_MAX_SCORER_WORKERS'
在使用外部 LLM API 作为裁判时,为每个评估项并行运行多个评分器时使用的最大并发评分器工作线程数。这有助于防止速率限制错误。当与 MLFLOW_GENAI_EVAL_MAX_WORKERS 结合使用时,实际的最大并发评分器调用次数受两者乘积的限制。设置为 1 以顺序运行评分器。(默认值:
10)
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_MAX_WORKERS = 'MLFLOW_GENAI_EVAL_MAX_WORKERS'
为传递给 mlflow.genai.evaluate 函数的数据集中的每一行运行模型预测和评分时使用的最大工作线程数。(默认值:
10)
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_SKIP_TRACE_VALIDATION = 'MLFLOW_GENAI_EVAL_SKIP_TRACE_VALIDATION'
在 GenAI 评估期间跳过跟踪验证。默认情况下(False),MLflow 将验证给定的预测函数是否生成了有效的跟踪,否则用 @mlflow.trace 装饰器包装它以确保生成跟踪。此验证需要运行一次预测。当您确定预测函数生成跟踪时,将此设置为 True 以跳过验证并节省运行一次预测的时间。
- mlflow.environment_variables.MLFLOW_GENAI_OPTIMIZE_MAX_WORKERS = 'MLFLOW_GENAI_OPTIMIZE_MAX_WORKERS'
在优化期间(例如 MemAlign)用于 LLM 调用的最大并行线程数。增加此值可以加快处理许多反馈示例时的对齐速度,但可能会增加 API 速率限制错误。(默认值:
8)
- mlflow.environment_variables.MLFLOW_HTTP_POOL_CONNECTIONS = 'MLFLOW_HTTP_POOL_CONNECTIONS'
指定要缓存的 urllib3 中的连接池数量。此环境变量设置
requests.adapters.HTTPAdapter构造函数中的 pool_connections 参数。通过调整此变量,用户可以提高 MLflow 发出的 HTTP 请求的并发性。
- mlflow.environment_variables.MLFLOW_HTTP_POOL_MAXSIZE = 'MLFLOW_HTTP_POOL_MAXSIZE'
指定 HTTP 连接池中要保留的最大连接数。此环境变量设置
requests.adapters.HTTPAdapter构造函数中的 pool_maxsize 参数。通过调整此变量,用户可以提高 MLflow 发出的 HTTP 请求的并发性。
- mlflow.environment_variables.MLFLOW_HTTP_REQUEST_BACKOFF_FACTOR = 'MLFLOW_HTTP_REQUEST_BACKOFF_FACTOR'
指定 MLflow HTTP 请求失败之间的指数退避因子(默认值:
2)
- mlflow.environment_variables.MLFLOW_HTTP_REQUEST_BACKOFF_JITTER = 'MLFLOW_HTTP_REQUEST_BACKOFF_JITTER'
指定 MLflow HTTP 请求失败之间的退避抖动(默认值:
1.0)
- mlflow.environment_variables.MLFLOW_HTTP_REQUEST_MAX_RETRIES = 'MLFLOW_HTTP_REQUEST_MAX_RETRIES'
指定 MLflow HTTP 请求的最大重试次数(带指数退避)(默认值:
7)
- mlflow.environment_variables.MLFLOW_HTTP_REQUEST_TIMEOUT = 'MLFLOW_HTTP_REQUEST_TIMEOUT'
指定 MLflow HTTP 请求的超时时间(秒)(默认值:
120)
- mlflow.environment_variables.MLFLOW_HTTP_RESPECT_RETRY_AFTER_HEADER = 'MLFLOW_HTTP_RESPECT_RETRY_AFTER_HEADER'
指定是否对 MLflow HTTP 请求中状态码为 Retry.RETRY_AFTER_STATUS_CODES 的响应中的 Retry-After 标头做出响应(默认值:
True)
- mlflow.environment_variables.MLFLOW_HUGGINGFACE_DEVICE_MAP_STRATEGY = 'MLFLOW_HUGGINGFACE_DEVICE_MAP_STRATEGY'
指定 Huggingface 使用 HuggingFace accelerate 的自动设备放置逻辑。可以设置为已安装的 HuggingFace Accelerate 版本支持的值。
- mlflow.environment_variables.MLFLOW_HUGGINGFACE_MODEL_MAX_SHARD_SIZE = 'MLFLOW_HUGGINGFACE_MODEL_MAX_SHARD_SIZE'
指定 mlflow transformers flavor 保存模型检查点时使用的 max_shard_size。可以设置为覆盖 500MB 的默认值。
- mlflow.environment_variables.MLFLOW_HUGGINGFACE_USE_LOW_CPU_MEM_USAGE = 'MLFLOW_HUGGINGFACE_USE_LOW_CPU_MEM_USAGE'
指定 Huggingface 使用由 HuggingFace accelerate 驱动的 low_cpu_mem_usage 标志。如果设置为 false,则 low_cpu_mem_usage 标志将设置为 False。
- mlflow.environment_variables.MLFLOW_INPUT_EXAMPLE_INFERENCE_TIMEOUT = 'MLFLOW_INPUT_EXAMPLE_INFERENCE_TIMEOUT'
指定在记录/保存模型时,使用输入示例进行模型推理的超时时间。MLflow 会对模型运行几次推理请求以推断模型签名和 pip 依赖项。有时预测会挂起很长时间,特别是对于大型模型。此超时将限制推断签名允许的预测时间,并中止预测,回退到默认签名和 pip 依赖项。
- mlflow.environment_variables.MLFLOW_JUDGE_MAX_ITERATIONS = 'MLFLOW_JUDGE_MAX_ITERATIONS'
指定调用 judge 模型时允许的最大完成迭代次数。这可以防止在跟踪复杂或 judge 推理出现问题时出现无限循环。(默认值:
30)
- mlflow.environment_variables.MLFLOW_KERBEROS_TICKET_CACHE = 'MLFLOW_KERBEROS_TICKET_CACHE'
指定用于 HDFS 工件操作的 Kerberos 票证缓存的位置。(默认值:
None)
- mlflow.environment_variables.MLFLOW_KERBEROS_USER = 'MLFLOW_KERBEROS_USER'
指定用于 HDFS 工件操作的 Kerberos 用户。(默认值:
None)
- mlflow.environment_variables.MLFLOW_LOCK_MODEL_DEPENDENCIES = 'MLFLOW_LOCK_MODEL_DEPENDENCIES'
如果为 True,MLflow 在记录模型时会锁定直接和间接模型依赖项。(默认值:
False)。
- mlflow.environment_variables.MLFLOW_LOGGING_LEVEL = 'MLFLOW_LOGGING_LEVEL'
指定 MLflow 的日志记录级别。可以设置为任何有效的日志记录级别(例如,“DEBUG”、“INFO”)。此环境必须在导入 mlflow 之前设置才能生效。要在导入 mlflow 后修改日志记录级别,请使用 importlib.reload(mlflow)。(默认值:
None)。
- mlflow.environment_variables.MLFLOW_LOG_MODEL_COMPRESSION = 'MLFLOW_LOG_MODEL_COMPRESSION'
指定记录模型时使用的工件压缩方法,允许的值为“lzma”、“bzip2”和“gzip”(默认值:
None,表示不压缩)
- mlflow.environment_variables.MLFLOW_MULTIPART_DOWNLOAD_CHUNK_SIZE = 'MLFLOW_MULTIPART_DOWNLOAD_CHUNK_SIZE'
指定执行分块下载时使用的字节块大小(默认值:
104_857_600(100 MB))
- mlflow.environment_variables.MLFLOW_MULTIPART_DOWNLOAD_MINIMUM_FILE_SIZE = 'MLFLOW_MULTIPART_DOWNLOAD_MINIMUM_FILE_SIZE'
指定下载工件时使用分块下载的最小文件大小(字节)(默认值:
524_288_000(500 MB))
- mlflow.environment_variables.MLFLOW_MULTIPART_UPLOAD_CHUNK_SIZE = 'MLFLOW_MULTIPART_UPLOAD_CHUNK_SIZE'
指定执行分块上传时使用的字节块大小(默认值:
104_857_60(10 MB))
- mlflow.environment_variables.MLFLOW_MULTIPART_UPLOAD_MINIMUM_FILE_SIZE = 'MLFLOW_MULTIPART_UPLOAD_MINIMUM_FILE_SIZE'
指定记录工件时使用分块上传的最小文件大小(字节)(默认值:
524_288_000(500 MB))
- mlflow.environment_variables.MLFLOW_MYSQL_SSL_CA = 'MLFLOW_MYSQL_SSL_CA'
MySQL 连接的 SSL CA 证书文件的路径。在为 MySQL 创建 SQLAlchemy 引擎时使用(默认值:
None)
- mlflow.environment_variables.MLFLOW_MYSQL_SSL_CERT = 'MLFLOW_MYSQL_SSL_CERT'
MySQL 连接的 SSL 证书文件的路径。在为 MySQL 创建 SQLAlchemy 引擎时使用(默认值:
None)
- mlflow.environment_variables.MLFLOW_MYSQL_SSL_KEY = 'MLFLOW_MYSQL_SSL_KEY'
MySQL 连接的 SSL 密钥文件的路径。在为 MySQL 创建 SQLAlchemy 引擎时使用(默认值:
None)
- mlflow.environment_variables.MLFLOW_ONLINE_SCORING_DEFAULT_SESSION_COMPLETION_BUFFER_SECONDS = 'MLFLOW_ONLINE_SCORING_DEFAULT_SESSION_COMPLETION_BUFFER_SECONDS'
在线评分前,将一个会话视为完成的默认缓冲时间(秒)。在此持续时间内没有新跟踪的会话将被视为完成并准备好进行评分。(默认值:
300(5 分钟))
- mlflow.environment_variables.MLFLOW_ONLINE_SCORING_MAX_WORKER_THREADS = 'MLFLOW_ONLINE_SCORING_MAX_WORKER_THREADS'
用于在线评分的最大工作线程数(包括跟踪级别和会话级别评分)。这控制了在后台在线评分作业期间并发处理多个跟踪或会话时的并行度。(默认值:
10)
- mlflow.environment_variables.MLFLOW_OPENAI_SECRET_SCOPE = 'MLFLOW_OPENAI_SECRET_SCOPE'
指定用于存储 OpenAI API 密钥的 Databricks 密钥范围的名称。
- mlflow.environment_variables.MLFLOW_PRINT_MODEL_URLS_ON_CREATION = 'MLFLOW_PRINT_MODEL_URLS_ON_CREATION'
启用在创建已记录和已注册模型时打印其 URL 的布尔标志。(默认值:
True)
- mlflow.environment_variables.MLFLOW_PROMPT_CACHE_MAX_SIZE = 'MLFLOW_PROMPT_CACHE_MAX_SIZE'
用于缓存 _load_prompt_version_cached 的提示版本的最大数量。此缓存通过避免对同一提示版本进行重复的网络调用来提高性能。(默认值:
128)
- mlflow.environment_variables.MLFLOW_PYARROW_EXTRA_CONF = 'MLFLOW_PYARROW_EXTRA_CONF'
指定 HDFS 工件操作的额外 pyarrow 配置。(默认值:
None)
- mlflow.environment_variables.MLFLOW_REGISTRY_DIR = 'MLFLOW_REGISTRY_DIR'
指定注册表 FileStore 的默认根目录。(默认值:
None)
- mlflow.environment_variables.MLFLOW_REQUIREMENTS_INFERENCE_RAISE_ERRORS = 'MLFLOW_REQUIREMENTS_INFERENCE_RAISE_ERRORS'
关于模型依赖项推断中无法解析的要求,是发出警告(默认)还是引发错误(选择加入)。如果设置为 True,则如果要求推断或捕获导入模块的过程遇到任何错误,将引发异常。
- mlflow.environment_variables.MLFLOW_REQUIREMENTS_INFERENCE_TIMEOUT = 'MLFLOW_REQUIREMENTS_INFERENCE_TIMEOUT'
指定 MLflow 模型依赖项推断操作的
timeout_seconds。(默认值:120)
- mlflow.environment_variables.MLFLOW_S3_ENDPOINT_URL = 'MLFLOW_S3_ENDPOINT_URL'
指定用于 S3 工件操作的 S3 端点 URL。(默认值:
None)
- mlflow.environment_variables.MLFLOW_S3_EXPECTED_BUCKET_OWNER = 'MLFLOW_S3_EXPECTED_BUCKET_OWNER'
指定用于 S3 存储桶所有权验证的 S3 存储桶所属的 AWS 账户 ID。设置后,所有 S3 API 调用都将包含 ExpectedBucketOwner 参数,以防止存储桶劫持攻击。这有助于保护存储桶被不同 AWS 账户删除和重新创建的场景。 (默认值:
None)
- mlflow.environment_variables.MLFLOW_S3_IGNORE_TLS = 'MLFLOW_S3_IGNORE_TLS'
指定是否跳过 S3 工件操作的 TLS 证书验证。(默认值:
False)
- mlflow.environment_variables.MLFLOW_S3_UPLOAD_EXTRA_ARGS = 'MLFLOW_S3_UPLOAD_EXTRA_ARGS'
指定 S3 工件上传的额外参数。(默认值:
None)
- mlflow.environment_variables.MLFLOW_SCORING_SERVER_REQUEST_TIMEOUT = 'MLFLOW_SCORING_SERVER_REQUEST_TIMEOUT'
指定 MLflow 模型评分服务器的请求超时时间(秒)(默认值:
60)
- mlflow.environment_variables.MLFLOW_SEARCH_TRACES_MAX_THREADS = 'MLFLOW_SEARCH_TRACES_MAX_THREADS'
在搜索操作期间下载跟踪时使用的最大线程数。(默认值:
max(32, (# of system CPUs * 4))
- mlflow.environment_variables.MLFLOW_SERVER_ALLOWED_HOSTS = 'MLFLOW_SERVER_ALLOWED_HOSTS'
(MLflow 3.5.0+) 允许的 MLflow 服务器 Host 标头的逗号分隔列表。示例:“mlflow.company.com,mlflow.internal:5000” 使用“*”允许所有主机(不推荐用于生产环境)。如果未设置,则默认为 localhost 变体和私有 IP 范围。(默认值:
None- localhost 和私有 IP 范围)
- mlflow.environment_variables.MLFLOW_SERVER_CORS_ALLOWED_ORIGINS = 'MLFLOW_SERVER_CORS_ALLOWED_ORIGINS'
(MLflow 3.5.0+) MLflow 服务器允许的 CORS 源的逗号分隔列表。示例:“https://:3000,https://app.example.com” 使用“*”允许所有源(危险 - 仅用于开发!)。(默认值:
None- 仅限 localhost 源)
- mlflow.environment_variables.MLFLOW_SERVER_DISABLE_SECURITY_MIDDLEWARE = 'MLFLOW_SERVER_DISABLE_SECURITY_MIDDLEWARE'
(MLflow 3.5.0+) 禁用所有安全中间件(危险 - 仅用于测试!)。设置为“true”以禁用安全标头、CORS 保护和主机验证。(默认值:
"false")
- mlflow.environment_variables.MLFLOW_SERVER_ENABLE_GRAPHQL_AUTH = 'MLFLOW_SERVER_ENABLE_GRAPHQL_AUTH'
是否为 MLflow 服务器中的 graphQL 路由启用授权。(默认值:
True)
- mlflow.environment_variables.MLFLOW_SERVER_ENABLE_JOB_EXECUTION = 'MLFLOW_SERVER_ENABLE_JOB_EXECUTION'
指定是否为 MLflow 服务器启用作业执行功能。此功能需要“huey”包依赖项,并要求 MLflow 服务器将 –backend-store-uri 配置为数据库 URI。如果启用但未满足要求,服务器将在作业调用时启动而没有作业执行支持,并且错误将在作业调用时显示。(默认值:
True)
- mlflow.environment_variables.MLFLOW_SERVER_GRAPHQL_MAX_ALIASES = 'MLFLOW_SERVER_GRAPHQL_MAX_ALIASES'
MLflow 服务器 GraphQL 请求中允许包含的最大别名数量。(默认值:
10)
- mlflow.environment_variables.MLFLOW_SERVER_GRAPHQL_MAX_ROOT_FIELDS = 'MLFLOW_SERVER_GRAPHQL_MAX_ROOT_FIELDS'
MLflow 服务器 GraphQL 请求中允许包含的最大根字段数量。(默认值:
10)
- mlflow.environment_variables.MLFLOW_SERVER_JOB_TRANSIENT_ERROR_MAX_RETRIES = 'MLFLOW_SERVER_JOB_TRANSIENT_ERROR_MAX_RETRIES'
指定 MLflow 服务器作业对瞬态错误的允许最大重试次数。(默认值:
3)
- mlflow.environment_variables.MLFLOW_SERVER_JOB_TRANSIENT_ERROR_RETRY_BASE_DELAY = 'MLFLOW_SERVER_JOB_TRANSIENT_ERROR_RETRY_BASE_DELAY'
指定 MLflow 服务器作业对瞬态错误的重试基准延迟(秒)。重试使用指数退避策略,重试延迟的计算方式为 delay = min(base_delay * (2 ** (retry_count - 1)), max_delay)(默认值:
15)
- mlflow.environment_variables.MLFLOW_SERVER_JOB_TRANSIENT_ERROR_RETRY_MAX_DELAY = 'MLFLOW_SERVER_JOB_TRANSIENT_ERROR_RETRY_MAX_DELAY'
指定 MLflow 服务器作业对瞬态错误的重试最大延迟(秒)。重试使用指数退避策略,重试延迟的计算方式为 delay = min(base_delay * (2 ** (retry_count - 1)), max_delay)(默认值:
60)
- mlflow.environment_variables.MLFLOW_SERVER_JUDGE_INVOKE_MAX_WORKERS = 'MLFLOW_SERVER_JUDGE_INVOKE_MAX_WORKERS'
指定异步 judge 调用的最大工作进程数。(默认值:
10)
- mlflow.environment_variables.MLFLOW_SERVER_ONLINE_SCORING_MAX_WORKERS = 'MLFLOW_SERVER_ONLINE_SCORING_MAX_WORKERS'
指定在线评分作业的最大工作进程数。(默认值:
5)
- mlflow.environment_variables.MLFLOW_SERVER_SCORER_INVOKE_BATCH_SIZE = 'MLFLOW_SERVER_SCORER_INVOKE_BATCH_SIZE'
将一批跟踪(数量)合并到一个评分器调用作业中。
- mlflow.environment_variables.MLFLOW_SERVER_X_FRAME_OPTIONS = 'MLFLOW_SERVER_X_FRAME_OPTIONS'
(MLflow 3.5.0+) 用于点击劫持保护的 X-Frame-Options 标头值。选项:“SAMEORIGIN”(默认值)、“DENY”或“NONE”(禁用)。设置为“NONE”以允许从不同源嵌入 MLflow UI 的 iframe 中。(默认值:
"SAMEORIGIN")
- mlflow.environment_variables.MLFLOW_SKIP_SIGNATURE_CHECK_FOR_UC_REGISTRY_MIGRATION = 'MLFLOW_SKIP_SIGNATURE_CHECK_FOR_UC_REGISTRY_MIGRATION'
在将模型版本从 Databricks 工作区模型注册表迁移到 Databricks Unity Catalog 模型注册表时跳过签名验证检查。(默认值:
False)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_ECHO = 'MLFLOW_SQLALCHEMYSTORE_ECHO'
指定用于 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine的echo参数。有关更多信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.echo。(默认值:False)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_MAX_OVERFLOW = 'MLFLOW_SQLALCHEMYSTORE_MAX_OVERFLOW'
指定用于 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine的max_overflow参数。有关更多信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.max_overflow。(默认值:None)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_POOLCLASS = 'MLFLOW_SQLALCHEMYSTORE_POOLCLASS'
指定用于 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine的poolclass参数。有关更多信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.poolclass。(默认值:None)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_POOL_RECYCLE = 'MLFLOW_SQLALCHEMYSTORE_POOL_RECYCLE'
指定用于 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine的pool_recycle参数。有关更多信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.pool_recycle。(默认值:None)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_POOL_SIZE = 'MLFLOW_SQLALCHEMYSTORE_POOL_SIZE'
指定用于 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine的pool_size参数。有关更多信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.pool_size。(默认值:None)
- mlflow.environment_variables.MLFLOW_SUPPRESS_PRINTING_URL_TO_STDOUT = 'MLFLOW_SUPPRESS_PRINTING_URL_TO_STDOUT'
避免在运行终止时将实验和运行 URL 打印到标准输出(默认值:
False)
- mlflow.environment_variables.MLFLOW_SYSTEM_METRICS_NODE_ID = 'MLFLOW_SYSTEM_METRICS_NODE_ID'
指定系统指标日志记录的节点 ID。这在多节点(分布式训练)设置中很有用。
- mlflow.environment_variables.MLFLOW_SYSTEM_METRICS_SAMPLES_BEFORE_LOGGING = 'MLFLOW_SYSTEM_METRICS_SAMPLES_BEFORE_LOGGING'
指定记录系统指标之前的样本数量。
- mlflow.environment_variables.MLFLOW_SYSTEM_METRICS_SAMPLING_INTERVAL = 'MLFLOW_SYSTEM_METRICS_SAMPLING_INTERVAL'
指定系统指标日志记录的采样间隔。
- mlflow.environment_variables.MLFLOW_TRACE_ENABLE_OTLP_DUAL_EXPORT = 'MLFLOW_TRACE_ENABLE_OTLP_DUAL_EXPORT'
当配置了 OTel 导出且此设置为 true 时,MLflow 将向 MLflow 跟踪服务器和 OpenTelemetry 收集器同时写入跨度。如果设置为 false(默认值),则 OTel 导出将取代 MLflow 导出。(默认值:
False)
- mlflow.environment_variables.MLFLOW_TRACE_SAMPLING_RATIO = 'MLFLOW_TRACE_SAMPLING_RATIO'
指定跟踪的采样率。值应在 0.0 和 1.0 之间。1.0 表示所有跟踪都被采样(默认行为)。0.5 表示采样 50% 的跟踪。0.0 表示没有跟踪被采样。(默认值:
1.0)
- mlflow.environment_variables.MLFLOW_TRACE_TIMEOUT_CHECK_INTERVAL_SECONDS = 'MLFLOW_TRACE_TIMEOUT_CHECK_INTERVAL_SECONDS'
检查超时跟踪的频率。例如,如果设置为 10,MLflow 将每 10 秒(在后台工作进程中)检查一次超时跟踪,并停止任何已超过超时的跟踪。仅当 MLFLOW_TRACE_TIMEOUT_SECONDS 设置为正值时才有效。
- mlflow.environment_variables.MLFLOW_TRACE_TIMEOUT_SECONDS = 'MLFLOW_TRACE_TIMEOUT_SECONDS'
跟踪可以“进行中”的时间长度。如果设置为正值且跟踪在此时间内未完成,它将被自动停止并以状态“ERROR”导出到指定的后端目标。
- mlflow.environment_variables.MLFLOW_TRACING_DESTINATION = 'MLFLOW_TRACING_DESTINATION'
指定发送跟踪的位置。这可以是 MLflow 实验 ID 或 Databricks Unity Catalog (UC) 模式(格式:<catalog_name>.<schema_name>)。(默认值:
None(将使用活动的 MLflow 实验))
- mlflow.environment_variables.MLFLOW_TRACING_SQL_WAREHOUSE_ID = 'MLFLOW_TRACING_SQL_WAREHOUSE_ID'
指定使用 Databricks 后端进行跟踪的 SQL 仓库 ID。(默认值:
None)
- mlflow.environment_variables.MLFLOW_TRACKING_AUTH = 'MLFLOW_TRACKING_AUTH'
指定用于签名 MLflow HTTP 请求的身份验证提供程序(默认值:
None)。设置后,它将覆盖“Authorization”HTTP 标头。
- mlflow.environment_variables.MLFLOW_TRACKING_AWS_SIGV4 = 'MLFLOW_TRACKING_AWS_SIGV4'
指定是否应使用 AWS 签名 V4 对 MLflow HTTP 请求进行签名。它将覆盖(默认值:
False)。设置后,它将覆盖“Authorization”HTTP 标头。有关更多信息,请参阅 https://docs.aws.amazon.com/general/latest/gr/signature-version-4.html。
- mlflow.environment_variables.MLFLOW_TRACKING_CLIENT_CERT_PATH = 'MLFLOW_TRACKING_CLIENT_CERT_PATH'
在
requests.request函数中设置cert参数,请参阅 https://requests.pythonlang.cn/en/master/api/(默认值:None)
- mlflow.environment_variables.MLFLOW_TRACKING_DIR = 'MLFLOW_TRACKING_DIR'
指定跟踪 FileStore 的默认根目录。(默认值:
None)
- mlflow.environment_variables.MLFLOW_TRACKING_INSECURE_TLS = 'MLFLOW_TRACKING_INSECURE_TLS'
指定是否在
requests.request函数中验证 TLS 连接,请参阅 https://requests.pythonlang.cn/en/master/api/(默认值:False)。
- mlflow.environment_variables.MLFLOW_TRACKING_PASSWORD = 'MLFLOW_TRACKING_PASSWORD'
指定用于向跟踪服务器进行身份验证的密码。(默认值:
None)
- mlflow.environment_variables.MLFLOW_TRACKING_SERVER_CERT_PATH = 'MLFLOW_TRACKING_SERVER_CERT_PATH'
在
requests.request函数中设置verify参数,请参阅 https://requests.pythonlang.cn/en/master/api/(默认值:None)
- mlflow.environment_variables.MLFLOW_TRACKING_TOKEN = 'MLFLOW_TRACKING_TOKEN'
指定并优先用于设置 http 请求上的基本/持有人身份验证。(默认值:
None)
- mlflow.environment_variables.MLFLOW_TRACKING_USERNAME = 'MLFLOW_TRACKING_USERNAME'
指定用于向跟踪服务器进行身份验证的用户名。(默认值:
None)
- mlflow.environment_variables.MLFLOW_TRUNCATE_LONG_VALUES = 'MLFLOW_TRUNCATE_LONG_VALUES'
如果设置为 True,则以下实体将被截断到其最大长度:- 参数值 - 标签值 如果设置为 False,如果实体长度超过最大长度,将引发异常。(默认值:
True)
- mlflow.environment_variables.MLFLOW_UC_OSS_TOKEN = 'MLFLOW_UC_OSS_TOKEN'
指定并优先用于设置 UC OSS http 请求上的基本/持有人身份验证。(默认值:
None)
- mlflow.environment_variables.MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC = 'MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC'
在向 Databricks UC 注册和加载模型时使用 DatabricksSDKModelsArtifactRepository。这对于启用了 SEG(安全出口网关)的工作区是必需的,并有助于消除与现有模型工件存储库类中使用的临时作用域令牌生成相关的模型外泄风险。
- mlflow.environment_variables.MLFLOW_USE_DEFAULT_TRACER_PROVIDER = 'MLFLOW_USE_DEFAULT_TRACER_PROVIDER'
True)- 类型
(默认
- mlflow.environment_variables.MLFLOW_VERSION_PROMPT_CACHE_TTL_SECONDS = 'MLFLOW_VERSION_PROMPT_CACHE_TTL_SECONDS'
/name/version” 存在于提示缓存中。超过此时间后,缓存的提示将被视为陈旧,并在下次访问时刷新。设置为 0 表示完全禁用缓存。(默认值:
float("inf"),无限 TTL)- 类型
基于版本的提示的缓存时间(以秒为单位),例如,“prompts
- mlflow.environment_variables.MLFLOW_WEBHOOK_CACHE_TTL = 'MLFLOW_WEBHOOK_CACHE_TTL'
指定 Webhook 列表缓存的 TTL(以秒为单位)(默认值:
60)
- mlflow.environment_variables.MLFLOW_WEBHOOK_DELIVERY_MAX_WORKERS = 'MLFLOW_WEBHOOK_DELIVERY_MAX_WORKERS'
指定 Webhook 传递线程池的最大线程数(默认值:
10)
- mlflow.environment_variables.MLFLOW_WEBHOOK_REQUEST_MAX_RETRIES = 'MLFLOW_WEBHOOK_REQUEST_MAX_RETRIES'
指定 Webhook HTTP 请求的最大重试次数(默认值:
3)
- mlflow.environment_variables.MLFLOW_WEBHOOK_REQUEST_TIMEOUT = 'MLFLOW_WEBHOOK_REQUEST_TIMEOUT'
指定 Webhook HTTP 请求的超时时间(以秒为单位)(默认值:
30)