mlflow.environment_variables
此模块定义了 MLflow 中使用的环境变量。MLflow 的环境变量遵循以下命名约定: - 公共变量:环境变量名称以 MLFLOW_ 开头 - 内部使用变量:仅供内部使用的变量,名称以 _MLFLOW_ 开头
- mlflow.environment_variables.MLFLOW_ACTIVE_MODEL_ID = 'MLFLOW_ACTIVE_MODEL_ID'
默认的活动 LoggedModel ID。在设置此变量时创建的跟踪(除非被覆盖,例如通过 set_active_model() API)将与此 LoggedModel ID 相关联。(默认值:
None)
- mlflow.environment_variables.MLFLOW_ALIAS_PROMPT_CACHE_TTL_SECONDS = 'MLFLOW_ALIAS_PROMPT_CACHE_TTL_SECONDS'
缓存的基于别名的提示的生存时间(以秒为单位),例如,“prompts
- 类型
缓存的基于别名的提示的生存时间(以秒为单位),例如,“prompts
- mlflow.environment_variables.MLFLOW_ALLOW_HTTP_REDIRECTS = 'MLFLOW_ALLOW_HTTP_REDIRECTS'
指定 MLflow 服务器在发出 HTTP 请求时是否允许重定向。如果设置为 False,服务器将在遇到重定向响应时抛出异常。(默认值:
True)
- mlflow.environment_variables.MLFLOW_ARTIFACT_LOCATION_MAX_LENGTH = 'MLFLOW_ARTIFACT_LOCATION_MAX_LENGTH'
指定实验的 artifact 位置的最大长度(以字符为单位)。默认值为 2048。
- mlflow.environment_variables.MLFLOW_ARTIFACT_UPLOAD_DOWNLOAD_TIMEOUT = 'MLFLOW_ARTIFACT_UPLOAD_DOWNLOAD_TIMEOUT'
(实验性,可能会更改或移除)指定上传或下载文件时使用的超时时间(默认值:
None)。如果为 None,则各个 artifact 存储将选择默认值。
- mlflow.environment_variables.MLFLOW_ASYNC_LOGGING_BUFFERING_SECONDS = 'MLFLOW_ASYNC_LOGGING_BUFFERING_SECONDS'
指定异步日志记录线程等待批次日志记录的秒数。
- mlflow.environment_variables.MLFLOW_ASYNC_LOGGING_THREADPOOL_SIZE = 'MLFLOW_ASYNC_LOGGING_THREADPOOL_SIZE'
用于异步日志记录的线程池中的工作线程数,默认为 10。
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_MAX_INTERVAL_MILLIS = 'MLFLOW_ASYNC_TRACE_LOGGING_MAX_INTERVAL_MILLIS'
两次批次之间的最大间隔(毫秒)。当达到此间隔时,MLflow 将导出当前批次中的 span,而不管批次大小。此间隔仅在最大批次大小设置为大于 1 时适用。注意:目前只有 Unity Catalog 表导出器支持批处理。其他导出器将立即导出 span。(默认值:
5000= 5 秒)
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_MAX_QUEUE_SIZE = 'MLFLOW_ASYNC_TRACE_LOGGING_MAX_QUEUE_SIZE'
用于异步跟踪日志记录的导出任务的最大队列大小。当队列已满时,将丢弃新的导出任务。(默认值:
1000)
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_MAX_SPAN_BATCH_SIZE = 'MLFLOW_ASYNC_TRACE_LOGGING_MAX_SPAN_BATCH_SIZE'
一次导出的 span 的最大数量。当设置为大于 1 时,MLflow 将批量导出 span。这必须与 MLFLOW_ENABLE_ASYNC_TRACE_LOGGING(默认值)设置为 true 一起使用。注意:目前只有 Unity Catalog 表导出器支持批处理。其他导出器将立即导出 span。(默认值:
1= 不进行批处理)
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_MAX_WORKERS = 'MLFLOW_ASYNC_TRACE_LOGGING_MAX_WORKERS'
用于异步跟踪日志记录的最大工作线程数。(默认值:
10)
- mlflow.environment_variables.MLFLOW_ASYNC_TRACE_LOGGING_RETRY_TIMEOUT = 'MLFLOW_ASYNC_TRACE_LOGGING_RETRY_TIMEOUT'
跟踪日志记录重试的超时秒数。(默认值:
500)
- mlflow.environment_variables.MLFLOW_AUTH_CONFIG_PATH = 'MLFLOW_AUTH_CONFIG_PATH'
指定 MLflow 身份验证的配置文件路径。(默认值:
None)
- mlflow.environment_variables.MLFLOW_CONDA_CREATE_ENV_CMD = 'MLFLOW_CONDA_CREATE_ENV_CMD'
指定创建环境时要使用的命令名称。例如,如果我们想使用 mamba(https://github.com/mamba-org/mamba)而不是 conda 来创建环境。然后: > conda install mamba -n base -c conda-forge 如果未设置,则使用与 conda_path 相同的值(默认值:
conda)
- mlflow.environment_variables.MLFLOW_CONFIGURE_LOGGING = 'MLFLOW_CONFIGURE_LOGGING'
指定在导入时是否配置日志记录。如果设置为 True,mlflow 将使用日志记录器和格式化程序配置
mlflow.<module_name>日志记录器。(默认值:True)
- mlflow.environment_variables.MLFLOW_CREATE_MODEL_VERSION_SOURCE_VALIDATION_REGEX = 'MLFLOW_CREATE_MODEL_VERSION_SOURCE_VALIDATION_REGEX'
如果指定,则跟踪服务器将拒绝源不匹配指定正则表达式的模型 /mlflow/model-versions/create 请求。(默认值:
None)。
- mlflow.environment_variables.MLFLOW_DATABRICKS_ENDPOINT_HTTP_RETRY_TIMEOUT = 'MLFLOW_DATABRICKS_ENDPOINT_HTTP_RETRY_TIMEOUT'
指定 Databricks 端点 HTTP 请求重试的超时秒数。
- mlflow.environment_variables.MLFLOW_DEFAULT_PREDICTION_DEVICE = 'MLFLOW_DEFAULT_PREDICTION_DEVICE'
指定在 predict 函数中使用的设备 - 可以通过将此环境变量设置为
cpu来覆盖默认情况下可用时使用 GPU 的行为。目前,此变量仅支持 MLflow PyTorch 和 HuggingFace 风格。对于 HuggingFace 风格,请注意 device 必须能够解析为整数。
- mlflow.environment_variables.MLFLOW_DEPLOYMENTS_CONFIG = 'MLFLOW_DEPLOYMENTS_CONFIG'
指定 MLflow AI Gateway 的配置文件路径。(默认值:
None)
- mlflow.environment_variables.MLFLOW_DEPLOYMENTS_TARGET = 'MLFLOW_DEPLOYMENTS_TARGET'
(实验性,可能会更改或移除)指定要与 Deployments Client API 配合使用的 MLflow AI Gateway 实例的 uri。(默认值:
None)
- mlflow.environment_variables.MLFLOW_DEPLOYMENT_CLIENT_HTTP_REQUEST_TIMEOUT = 'MLFLOW_DEPLOYMENT_CLIENT_HTTP_REQUEST_TIMEOUT'
指定 MLflow 部署客户端 HTTP 请求(非预测操作)的超时秒数。这与 MLFLOW_HTTP_REQUEST_TIMEOUT 分开,以便为 LLM 调用提供更长的超时时间。(默认值:
300)
- mlflow.environment_variables.MLFLOW_DEPLOYMENT_FLAVOR_NAME = 'MLFLOW_DEPLOYMENT_FLAVOR_NAME'
指定在评分服务器中服务的 flavor。(默认值
None)
- mlflow.environment_variables.MLFLOW_DEPLOYMENT_PREDICT_TIMEOUT = 'MLFLOW_DEPLOYMENT_PREDICT_TIMEOUT'
部署端点单个 HTTP 请求的超时时间(以秒为单位)。此设置控制单个 predict/predict_stream 请求在超时之前可以花费的时间。如果您的模型推理时间超过此值(例如,耗时数分钟的长运行代理查询),则必须增加此值以允许单个请求完成。例如,如果最长的查询耗时 5 分钟,请将此值至少设置为 300 秒。在 predict 和 predict_stream API 中使用。(默认值:
120)
- mlflow.environment_variables.MLFLOW_DEPLOYMENT_PREDICT_TOTAL_TIMEOUT = 'MLFLOW_DEPLOYMENT_PREDICT_TOTAL_TIMEOUT'
所有重试尝试总计的时间限制(以秒为单位)。此设置控制客户端在完全放弃之前将重试失败请求的总时间。这与 MLFLOW_DEPLOYMENT_PREDICT_TIMEOUT 是分开的,后者控制单个请求可以运行多长时间,而此变量控制所有重试的总时间。对于可能经历瞬时故障的长运行操作,请确保同时设置这两个超时时间。此值应大于或等于 MLFLOW_DEPLOYMENT_PREDICT_TIMEOUT。(默认值:
600)
- mlflow.environment_variables.MLFLOW_DFS_TMP = 'MLFLOW_DFS_TMP'
为
mlflow.spark.save_model、mlflow.spark.log_model和mlflow.spark.load_model指定要使用的dfs_tmpdir参数。有关更多信息,请参阅 https://www.mlflow.org/docs/latest/python_api/mlflow.spark.html#mlflow.spark.save_model。(默认值:/tmp/mlflow)
- mlflow.environment_variables.MLFLOW_DISABLE_DATABRICKS_SDK_FOR_RUN_ARTIFACTS = 'MLFLOW_DISABLE_DATABRICKS_SDK_FOR_RUN_ARTIFACTS'
禁用用于运行 artifact 的 Databricks SDK。我们默认启用此功能,因为我们希望在大多数情况下使用 Databricks SDK 来处理运行 artifact,但这为我们在需要时禁用它提供了一种方式。
- mlflow.environment_variables.MLFLOW_DISABLE_ENV_CREATION = 'MLFLOW_DISABLE_ENV_CREATION'
指定是否禁用为 mlflow models build-docker 创建新的 conda 环境。(默认值:
False)
- mlflow.environment_variables.MLFLOW_DISABLE_ENV_MANAGER_CONDA_WARNING = 'MLFLOW_DISABLE_ENV_MANAGER_CONDA_WARNING'
指定当指定 –env-manager=conda 时是否打印警告。(默认值:
False)
- mlflow.environment_variables.MLFLOW_DISABLE_SCHEMA_DETAILS = 'MLFLOW_DISABLE_SCHEMA_DETAILS'
是否禁用 MLflow 模式强制错误消息中的模式详细信息。(默认值:
False)
- mlflow.environment_variables.MLFLOW_DISABLE_TELEMETRY = 'MLFLOW_DISABLE_TELEMETRY'
是否禁用 MLflow 中的遥测数据收集。如果设置为 True,则不会收集任何遥测数据。(默认值:
False)
- mlflow.environment_variables.MLFLOW_DOCKER_OPENJDK_VERSION = 'MLFLOW_DOCKER_OPENJDK_VERSION'
用于 MLflow 模型的 Docker 映像中要安装的 OpenJDK 版本。(默认值:
11)
- mlflow.environment_variables.MLFLOW_DOWNLOAD_CHUNK_TIMEOUT = 'MLFLOW_DOWNLOAD_CHUNK_TIMEOUT'
指定下载 MLflow artifact 块的超时值。(默认值:
300)
- mlflow.environment_variables.MLFLOW_ENABLE_ARTIFACTS_PROGRESS_BAR = 'MLFLOW_ENABLE_ARTIFACTS_PROGRESS_BAR'
指定在上传/下载 artifact 时是否显示进度条。(默认值:
True)
- mlflow.environment_variables.MLFLOW_ENABLE_ASYNC_LOGGING = 'MLFLOW_ENABLE_ASYNC_LOGGING'
如果为 True,则 MLflow 流畅日志 API(例如,mlflow.log_metric)将异步记录。
- mlflow.environment_variables.MLFLOW_ENABLE_ASYNC_TRACE_LOGGING = 'MLFLOW_ENABLE_ASYNC_TRACE_LOGGING'
指定是否启用异步跟踪日志记录到 Databricks Tracing Server。TODO:更新 OSS MLflow Server 以默认异步记录。默认值:
True。
- mlflow.environment_variables.MLFLOW_ENABLE_DBFS_FUSE_ARTIFACT_REPO = 'MLFLOW_ENABLE_DBFS_FUSE_ARTIFACT_REPO'
指定是否使用 DBFS FUSE 挂载在 Databricks 上存储 artifact(默认值:
False)
- mlflow.environment_variables.MLFLOW_ENABLE_DB_SDK = 'MLFLOW_ENABLE_DB_SDK'
是否启用 Databricks SDK。如果为 true,MLflow 使用 databricks-sdk 向 Databricks 端点发送 HTTP 请求;否则,MLflow 使用
requests库向 Databricks 端点发送 HTTP 请求。请注意,如果您想使用 OAuth 身份验证,则必须将此环境变量设置为 true。(默认值:True)
- mlflow.environment_variables.MLFLOW_ENABLE_OTLP_EXPORTER = 'MLFLOW_ENABLE_OTLP_EXPORTER'
控制当 OTEL_EXPORTER_OTLP_TRACES_ENDPOINT 设置时,MLflow 是否应将跟踪导出到 OTLP 端点。这允许用户即使在为其他遥测客户端配置了 OTEL 端点时禁用 MLflow 的 OTLP 导出。(默认值:
True)
- mlflow.environment_variables.MLFLOW_ENABLE_PROXY_MULTIPART_UPLOAD = 'MLFLOW_ENABLE_PROXY_MULTIPART_UPLOAD'
指定是否使用分块上传来代理 artifact 访问。(默认值:
False)
- mlflow.environment_variables.MLFLOW_ENABLE_SYSTEM_METRICS_LOGGING = 'MLFLOW_ENABLE_SYSTEM_METRICS_LOGGING'
指定是否启用系统指标日志记录。
- mlflow.environment_variables.MLFLOW_ENABLE_UC_FUNCTIONS = 'MLFLOW_ENABLE_UC_FUNCTIONS'
(已弃用)启用 MLflow AI Gateway 的 Unity Catalog 集成。此功能已弃用,将在未来版本中移除。(默认值:
False)
- mlflow.environment_variables.MLFLOW_ENABLE_UC_VOLUME_FUSE_ARTIFACT_REPO = 'MLFLOW_ENABLE_UC_VOLUME_FUSE_ARTIFACT_REPO'
指定是否使用 UC Volume FUSE 挂载在 Databricks 上存储 artifact(默认值:
True)
- mlflow.environment_variables.MLFLOW_ENFORCE_STDIN_SCORING_SERVER_FOR_SPARK_UDF = 'MLFLOW_ENFORCE_STDIN_SCORING_SERVER_FOR_SPARK_UDF'
指定是否强制在 Spark udf 中使用 stdin 评分服务器。(默认值:
True)
- mlflow.environment_variables.MLFLOW_ENV_ROOT = 'MLFLOW_ENV_ROOT'
指定在其中创建 Python 虚拟环境的根目录。(默认值:
~/.mlflow/envs)
- mlflow.environment_variables.MLFLOW_EXPERIMENT_ID = 'MLFLOW_EXPERIMENT_ID'
指定创建运行的默认实验 ID。(默认值:
None)
- mlflow.environment_variables.MLFLOW_EXPERIMENT_NAME = 'MLFLOW_EXPERIMENT_NAME'
指定创建运行的默认实验名称。(默认值:
None)
- mlflow.environment_variables.MLFLOW_FLASK_SERVER_SECRET_KEY = 'MLFLOW_FLASK_SERVER_SECRET_KEY'
Flask 应用的密钥。当在启用了基本身份验证的情况下运行该应用时,此密钥对于启用 UI 注册页面的 CSRF 保护是必需的
- mlflow.environment_variables.MLFLOW_GATEWAY_CONFIG = 'MLFLOW_GATEWAY_CONFIG'
指定 MLflow AI Gateway 的配置文件路径。(默认值:
None)
- mlflow.environment_variables.MLFLOW_GATEWAY_URI = 'MLFLOW_GATEWAY_URI'
(实验性,可能会更改或移除)指定要与 Gateway Client API 配合使用的 MLflow Gateway Server 实例的 uri。(默认值:
None)
- mlflow.environment_variables.MLFLOW_GCS_DOWNLOAD_CHUNK_SIZE = 'MLFLOW_GCS_DOWNLOAD_CHUNK_SIZE'
指定从 GCS 下载文件时要使用的块大小(默认值:
None)。如果为 None,则块大小由google-cloud-storage包自动确定。
- mlflow.environment_variables.MLFLOW_GCS_UPLOAD_CHUNK_SIZE = 'MLFLOW_GCS_UPLOAD_CHUNK_SIZE'
指定上传文件到 GCS 时要使用的块大小。(默认值:
None)。如果为 None,则块大小由google-cloud-storage包自动确定。
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_ASYNC_TIMEOUT = 'MLFLOW_GENAI_EVAL_ASYNC_TIMEOUT'
mlflow.genai.evaluate 中异步 predict 函数的超时秒数。当将异步函数作为 predict_fn 传递时,它将被包装在带有此超时的 asyncio.run() 中。(默认值:
300)
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_ENABLE_SCORER_TRACING = 'MLFLOW_GENAI_EVAL_ENABLE_SCORER_TRACING'
启用评估评分器的跟踪。默认情况下(False),MLflow 不会跟踪评分器函数调用。要跟踪评分器函数以进行调试,请将其设置为 True。
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_MAX_SCORER_WORKERS = 'MLFLOW_GENAI_EVAL_MAX_SCORER_WORKERS'
在为传递给 mlflow.genai.evaluate 函数的数据集中的每个评估项并行运行多个评分器时使用的最大并发评分器工作线程数。这有助于防止在使用外部 LLM API 作为裁判时出现速率限制错误。实际工作线程数不会超过正在使用的评分器数量。当与 MLFLOW_GENAI_EVAL_MAX_WORKERS 结合使用时,总并发评分器调用数受两者乘积的限制。设置为 1 以顺序运行评分器。(默认值:
10)
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_MAX_WORKERS = 'MLFLOW_GENAI_EVAL_MAX_WORKERS'
在 mlflow.genai.evaluate 函数的数据集中的每一行运行时,用于模型预测和评分的最大工作线程数。(默认值:
10)
- mlflow.environment_variables.MLFLOW_GENAI_EVAL_SKIP_TRACE_VALIDATION = 'MLFLOW_GENAI_EVAL_SKIP_TRACE_VALIDATION'
在 GenAI 评估期间跳过跟踪验证。默认情况下(False),MLflow 将验证给定的 predict 函数是否生成了有效的跟踪,否则将使用 @mlflow.trace 装饰器包装它以确保生成跟踪。此验证需要运行一次预测。当您确定 predict 函数生成了跟踪时,请将其设置为 True 以跳过验证并节省一次预测运行的时间。
- mlflow.environment_variables.MLFLOW_HTTP_POOL_CONNECTIONS = 'MLFLOW_HTTP_POOL_CONNECTIONS'
指定要缓存的 urllib3 连接池的数量。此环境变量设置 requests.adapters.HTTPAdapter 构造函数中的 pool_connections 参数。通过调整此变量,用户可以提高 MLflow 发出的 HTTP 请求的并发性。
- mlflow.environment_variables.MLFLOW_HTTP_POOL_MAXSIZE = 'MLFLOW_HTTP_POOL_MAXSIZE'
指定要保留在 HTTP 连接池中的最大连接数。此环境变量设置 requests.adapters.HTTPAdapter 构造函数中的 pool_maxsize 参数。通过调整此变量,用户可以提高 MLflow 发出的 HTTP 请求的并发性。
- mlflow.environment_variables.MLFLOW_HTTP_REQUEST_BACKOFF_FACTOR = 'MLFLOW_HTTP_REQUEST_BACKOFF_FACTOR'
指定 MLflow HTTP 请求失败之间的退避增加因子(默认值:
2)
- mlflow.environment_variables.MLFLOW_HTTP_REQUEST_BACKOFF_JITTER = 'MLFLOW_HTTP_REQUEST_BACKOFF_JITTER'
指定 MLflow HTTP 请求失败之间的退避抖动(默认值:
1.0)
- mlflow.environment_variables.MLFLOW_HTTP_REQUEST_MAX_RETRIES = 'MLFLOW_HTTP_REQUEST_MAX_RETRIES'
指定 MLflow HTTP 请求的指数退避最大重试次数(默认值:
7)
- mlflow.environment_variables.MLFLOW_HTTP_REQUEST_TIMEOUT = 'MLFLOW_HTTP_REQUEST_TIMEOUT'
指定 MLflow HTTP 请求的超时时间(秒)(默认值:
120)
- mlflow.environment_variables.MLFLOW_HTTP_RESPECT_RETRY_AFTER_HEADER = 'MLFLOW_HTTP_RESPECT_RETRY_AFTER_HEADER'
指定是否为 MLflow HTTP 请求遵循 Retry.RETRY_AFTER_STATUS_CODES 中定义的响应码的 Retry-After 标头(默认值:
True)
- mlflow.environment_variables.MLFLOW_HUGGINGFACE_DEVICE_MAP_STRATEGY = 'MLFLOW_HUGGINGFACE_DEVICE_MAP_STRATEGY'
指示 Huggingface 使用 HuggingFace accelerate 的自动设备放置逻辑。此值可设置为正在安装的 HuggingFace Accelerate 版本支持的值。
- mlflow.environment_variables.MLFLOW_HUGGINGFACE_MODEL_MAX_SHARD_SIZE = 'MLFLOW_HUGGINGFACE_MODEL_MAX_SHARD_SIZE'
指定当 MLflow transformers flavor 保存模型检查点时使用的 max_shard_size。此值可以设置为覆盖 500MB 的默认值。
- mlflow.environment_variables.MLFLOW_HUGGINGFACE_USE_LOW_CPU_MEM_USAGE = 'MLFLOW_HUGGINGFACE_USE_LOW_CPU_MEM_USAGE'
指示 Huggingface 使用 HuggingFace accelerate 提供的 low_cpu_mem_usage 标志。如果设置为 false,则 low_cpu_mem_usage 标志将被设置为 False。
- mlflow.environment_variables.MLFLOW_INPUT_EXAMPLE_INFERENCE_TIMEOUT = 'MLFLOW_INPUT_EXAMPLE_INFERENCE_TIMEOUT'
指定在记录/保存模型时,使用输入示例进行模型推理的超时时间。MLflow 会对模型运行几次推理请求来推断模型签名和 pip 需求。有时预测会挂起很长时间,特别是对于大型模型。此超时时间限制了签名推理的预测可接受的时间,并会中止预测,回退到默认签名和 pip 需求。
- mlflow.environment_variables.MLFLOW_JUDGE_MAX_ITERATIONS = 'MLFLOW_JUDGE_MAX_ITERATIONS'
指定调用 judge 模型时允许的最大完成迭代次数。这可以防止在跟踪复杂或 judge 推理问题时出现无限循环(默认值:
30)
- mlflow.environment_variables.MLFLOW_KERBEROS_TICKET_CACHE = 'MLFLOW_KERBEROS_TICKET_CACHE'
指定用于 HDFS 伪影操作的 Kerberos 票证缓存位置。(默认值:
None)
- mlflow.environment_variables.MLFLOW_KERBEROS_USER = 'MLFLOW_KERBEROS_USER'
指定用于 HDFS 伪影操作的 Kerberos 用户。(默认值:
None)
- mlflow.environment_variables.MLFLOW_LOCK_MODEL_DEPENDENCIES = 'MLFLOW_LOCK_MODEL_DEPENDENCIES'
如果为 True,MLflow 在记录模型时将锁定直接和传递的模型依赖项。(默认值:
False)。
- mlflow.environment_variables.MLFLOW_LOGGING_LEVEL = 'MLFLOW_LOGGING_LEVEL'
指定 MLflow 的日志级别。此值可以设置为任何有效的日志级别(例如,“DEBUG”、“INFO”)。此环境变量必须在导入 mlflow 之前设置才能生效。要在导入 mlflow 后修改日志级别,请使用 importlib.reload(mlflow)。(默认值:
None)。
- mlflow.environment_variables.MLFLOW_LOG_MODEL_COMPRESSION = 'MLFLOW_LOG_MODEL_COMPRESSION'
指定记录模型时使用的伪影压缩方法,允许值为“lzma”、“bzip2”和“gzip”(默认值:
None,表示不压缩)
- mlflow.environment_variables.MLFLOW_MULTIPART_DOWNLOAD_CHUNK_SIZE = 'MLFLOW_MULTIPART_DOWNLOAD_CHUNK_SIZE'
指定执行分块下载时使用的块大小(字节)(默认值:
104_857_600(100 MB))
- mlflow.environment_variables.MLFLOW_MULTIPART_DOWNLOAD_MINIMUM_FILE_SIZE = 'MLFLOW_MULTIPART_DOWNLOAD_MINIMUM_FILE_SIZE'
指定下载伪影时使用分块下载的最小文件大小(字节)(默认值:
524_288_000(500 MB))
- mlflow.environment_variables.MLFLOW_MULTIPART_UPLOAD_CHUNK_SIZE = 'MLFLOW_MULTIPART_UPLOAD_CHUNK_SIZE'
指定执行分块上传时使用的块大小(字节)(默认值:
104_857_60(10 MB))
- mlflow.environment_variables.MLFLOW_MULTIPART_UPLOAD_MINIMUM_FILE_SIZE = 'MLFLOW_MULTIPART_UPLOAD_MINIMUM_FILE_SIZE'
指定记录伪影时使用分块上传的最小文件大小(字节)(默认值:
524_288_000(500 MB))
- mlflow.environment_variables.MLFLOW_MYSQL_SSL_CA = 'MLFLOW_MYSQL_SSL_CA'
用于 MySQL 连接的 SSL CA 证书文件路径。创建 MySQL 的 SQLAlchemy 引擎时使用(默认值:
None)
- mlflow.environment_variables.MLFLOW_MYSQL_SSL_CERT = 'MLFLOW_MYSQL_SSL_CERT'
用于 MySQL 连接的 SSL 证书文件路径。创建 MySQL 的 SQLAlchemy 引擎时使用(默认值:
None)
- mlflow.environment_variables.MLFLOW_MYSQL_SSL_KEY = 'MLFLOW_MYSQL_SSL_KEY'
用于 MySQL 连接的 SSL 密钥文件路径。创建 MySQL 的 SQLAlchemy 引擎时使用(默认值:
None)
- mlflow.environment_variables.MLFLOW_OPENAI_SECRET_SCOPE = 'MLFLOW_OPENAI_SECRET_SCOPE'
指定用于存储 OpenAI API 密钥的 Databricks 密钥范围的名称。
- mlflow.environment_variables.MLFLOW_PRINT_MODEL_URLS_ON_CREATION = 'MLFLOW_PRINT_MODEL_URLS_ON_CREATION'
一个布尔标志,用于在创建时打印已记录和注册模型的 URL。(默认值:
True)
- mlflow.environment_variables.MLFLOW_PROMPT_CACHE_MAX_SIZE = 'MLFLOW_PROMPT_CACHE_MAX_SIZE'
在 LRU 缓存中缓存 _load_prompt_version_cached 的最大提示版本数。此缓存通过避免对同一提示版本进行重复的网络调用来提高性能。(默认值:
128)
- mlflow.environment_variables.MLFLOW_PYARROW_EXTRA_CONF = 'MLFLOW_PYARROW_EXTRA_CONF'
指定用于 HDFS 伪影操作的额外 pyarrow 配置。(默认值:
None)
- mlflow.environment_variables.MLFLOW_REGISTRY_DIR = 'MLFLOW_REGISTRY_DIR'
指定注册表 FileStore 的默认根目录。(默认值:
None)
- mlflow.environment_variables.MLFLOW_REQUIREMENTS_INFERENCE_RAISE_ERRORS = 'MLFLOW_REQUIREMENTS_INFERENCE_RAISE_ERRORS'
在模型依赖项推断的不可解析需求推断时,是发出警告(默认)还是引发错误(选择加入)。如果设置为 True,则在需求推断或捕获导入模块的过程中遇到任何错误时,将引发异常。
- mlflow.environment_variables.MLFLOW_REQUIREMENTS_INFERENCE_TIMEOUT = 'MLFLOW_REQUIREMENTS_INFERENCE_TIMEOUT'
指定 MLflow 模型依赖项推断操作的
timeout_seconds。(默认值:120)
- mlflow.environment_variables.MLFLOW_S3_ENDPOINT_URL = 'MLFLOW_S3_ENDPOINT_URL'
指定用于 S3 伪影操作的 S3 端点 URL。(默认值:
None)
- mlflow.environment_variables.MLFLOW_S3_EXPECTED_BUCKET_OWNER = 'MLFLOW_S3_EXPECTED_BUCKET_OWNER'
指定用于 S3 存储桶所有权验证的预期 S3 存储桶所有者 AWS 账户 ID。设置后,所有 S3 API 调用都将包含 ExpectedBucketOwner 参数,以防止存储桶被劫持攻击。这有助于保护已删除并由其他 AWS 账户以相同名称重新创建的存储桶免受此类情况的影响。(默认值:
None)
- mlflow.environment_variables.MLFLOW_S3_IGNORE_TLS = 'MLFLOW_S3_IGNORE_TLS'
指定是否跳过 S3 伪影操作的 TLS 证书验证。(默认值:
False)
- mlflow.environment_variables.MLFLOW_S3_UPLOAD_EXTRA_ARGS = 'MLFLOW_S3_UPLOAD_EXTRA_ARGS'
指定用于 S3 伪影上传的额外参数。(默认值:
None)
- mlflow.environment_variables.MLFLOW_SCORING_SERVER_REQUEST_TIMEOUT = 'MLFLOW_SCORING_SERVER_REQUEST_TIMEOUT'
指定 MLflow 模型评分服务器请求超时时间(秒)(默认值:
60)
- mlflow.environment_variables.MLFLOW_SEARCH_TRACES_MAX_THREADS = 'MLFLOW_SEARCH_TRACES_MAX_THREADS'
在搜索操作期间下载跟踪的最大线程数。(默认值:
max(32, (# of system CPUs * 4))
- mlflow.environment_variables.MLFLOW_SERVER_ALLOWED_HOSTS = 'MLFLOW_SERVER_ALLOWED_HOSTS'
(MLflow 3.5.0+) MLflow 服务器允许的 Host 标头的逗号分隔列表。示例:“mlflow.company.com,mlflow.internal:5000” 使用“*”允许所有主机(不建议在生产环境中使用)。如果未设置,则默认为 localhost 变体和私有 IP 范围。(默认值:
None- localhost 和私有 IP 范围)
- mlflow.environment_variables.MLFLOW_SERVER_CORS_ALLOWED_ORIGINS = 'MLFLOW_SERVER_CORS_ALLOWED_ORIGINS'
(MLflow 3.5.0+) MLflow 服务器允许的 CORS 源的逗号分隔列表。示例:“https://:3000,https://app.example.com” 使用“*”允许所有源(危险 - 仅用于开发!)。(默认值:
None- 仅限 localhost 源)
- mlflow.environment_variables.MLFLOW_SERVER_DISABLE_SECURITY_MIDDLEWARE = 'MLFLOW_SERVER_DISABLE_SECURITY_MIDDLEWARE'
(MLflow 3.5.0+) 禁用所有安全中间件(危险 - 仅用于测试!)。设置为“true”以禁用安全标头、CORS 保护和主机验证。(默认值:
"false")
- mlflow.environment_variables.MLFLOW_SERVER_ENABLE_GRAPHQL_AUTH = 'MLFLOW_SERVER_ENABLE_GRAPHQL_AUTH'
是否为 MLflow 服务器中的 graphQL 路由启用授权。(默认值:
True)
- mlflow.environment_variables.MLFLOW_SERVER_ENABLE_JOB_EXECUTION = 'MLFLOW_SERVER_ENABLE_JOB_EXECUTION'
指定是否为 MLflow 服务器启用作业执行功能。此功能需要“huey”包依赖项,并且要求 MLflow 服务器将 --backend-store-uri 配置为数据库 URI。(默认值:
False)
- mlflow.environment_variables.MLFLOW_SERVER_GRAPHQL_MAX_ALIASES = 'MLFLOW_SERVER_GRAPHQL_MAX_ALIASES'
MLflow 服务器 GraphQL 请求中包含的最大别名数。(默认值:
10)
- mlflow.environment_variables.MLFLOW_SERVER_GRAPHQL_MAX_ROOT_FIELDS = 'MLFLOW_SERVER_GRAPHQL_MAX_ROOT_FIELDS'
MLflow 服务器 GraphQL 请求中包含的最大根字段数。(默认值:
10)
- mlflow.environment_variables.MLFLOW_SERVER_JOB_TRANSIENT_ERROR_MAX_RETRIES = 'MLFLOW_SERVER_JOB_TRANSIENT_ERROR_MAX_RETRIES'
指定 MLflow 服务器作业对暂时性错误的允许最大重试次数。(默认值:
3)
- mlflow.environment_variables.MLFLOW_SERVER_JOB_TRANSIENT_ERROR_RETRY_BASE_DELAY = 'MLFLOW_SERVER_JOB_TRANSIENT_ERROR_RETRY_BASE_DELAY'
指定 MLflow 服务器作业对暂时性错误的重试基础延迟(秒)。重试使用指数退避策略,重试延迟通过 delay = min(base_delay * (2 ** (retry_count - 1)), max_delay) 计算(默认值:
15)
- mlflow.environment_variables.MLFLOW_SERVER_JOB_TRANSIENT_ERROR_RETRY_MAX_DELAY = 'MLFLOW_SERVER_JOB_TRANSIENT_ERROR_RETRY_MAX_DELAY'
指定 MLflow 服务器作业对暂时性错误的重试最大延迟(秒)。重试使用指数退避策略,重试延迟通过 delay = min(base_delay * (2 ** (retry_count - 1)), max_delay) 计算(默认值:
60)
- mlflow.environment_variables.MLFLOW_SERVER_X_FRAME_OPTIONS = 'MLFLOW_SERVER_X_FRAME_OPTIONS'
(MLflow 3.5.0+) 用于防止点击劫持的 X-Frame-Options 标头值。选项:“SAMEORIGIN”(默认)、“DENY”或“NONE”(禁用)。设置为“NONE”以允许将 MLflow UI 嵌入到不同源的 iframe 中。(默认值:
"SAMEORIGIN")
- mlflow.environment_variables.MLFLOW_SKIP_SIGNATURE_CHECK_FOR_UC_REGISTRY_MIGRATION = 'MLFLOW_SKIP_SIGNATURE_CHECK_FOR_UC_REGISTRY_MIGRATION'
在将模型版本从 Databricks Workspace Model Registry 迁移到 Databricks Unity Catalog Model Registry 时,跳过签名验证检查。(默认值:
False)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_ECHO = 'MLFLOW_SQLALCHEMYSTORE_ECHO'
指定 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine使用的echo参数。有关详细信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.echo。(默认值:False)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_MAX_OVERFLOW = 'MLFLOW_SQLALCHEMYSTORE_MAX_OVERFLOW'
指定 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine使用的max_overflow参数。有关详细信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.max_overflow。(默认值:None)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_POOLCLASS = 'MLFLOW_SQLALCHEMYSTORE_POOLCLASS'
指定 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine使用的poolclass参数。有关详细信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.poolclass。(默认值:None)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_POOL_RECYCLE = 'MLFLOW_SQLALCHEMYSTORE_POOL_RECYCLE'
指定 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine使用的pool_recycle参数。有关详细信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.pool_recycle。(默认值:None)
- mlflow.environment_variables.MLFLOW_SQLALCHEMYSTORE_POOL_SIZE = 'MLFLOW_SQLALCHEMYSTORE_POOL_SIZE'
指定 SQLAlchemy 跟踪存储中
sqlalchemy.create_engine使用的pool_size参数。有关详细信息,请参阅 https://docs.sqlalchemy.org.cn/en/14/core/engines.html#sqlalchemy.create_engine.params.pool_size。(默认值:None)
- mlflow.environment_variables.MLFLOW_SUPPRESS_PRINTING_URL_TO_STDOUT = 'MLFLOW_SUPPRESS_PRINTING_URL_TO_STDOUT'
避免在运行结束时向 stdout 打印实验和运行 URL(默认值:
False)
- mlflow.environment_variables.MLFLOW_SYSTEM_METRICS_NODE_ID = 'MLFLOW_SYSTEM_METRICS_NODE_ID'
指定系统指标日志记录的节点 ID。这在多节点(分布式训练)设置中非常有用。
- mlflow.environment_variables.MLFLOW_SYSTEM_METRICS_SAMPLES_BEFORE_LOGGING = 'MLFLOW_SYSTEM_METRICS_SAMPLES_BEFORE_LOGGING'
指定在记录系统指标之前要采样的样本数量。
- mlflow.environment_variables.MLFLOW_SYSTEM_METRICS_SAMPLING_INTERVAL = 'MLFLOW_SYSTEM_METRICS_SAMPLING_INTERVAL'
指定系统指标日志记录的采样间隔。
- mlflow.environment_variables.MLFLOW_TRACE_ENABLE_OTLP_DUAL_EXPORT = 'MLFLOW_TRACE_ENABLE_OTLP_DUAL_EXPORT'
当配置了 OTel 导出并且此设置为 true 时,MLflow 将跨度同时写入 MLflow 跟踪服务器和 OpenTelemetry Collector。当设置为 false(默认)时,OTel 导出将替换 MLflow 导出。(默认:
False)
- mlflow.environment_variables.MLFLOW_TRACE_SAMPLING_RATIO = 'MLFLOW_TRACE_SAMPLING_RATIO'
指定跟踪的采样率。值应介于 0.0 和 1.0 之间。值为 1.0 表示对所有跟踪进行采样(默认行为)。值为 0.5 表示对 50% 的跟踪进行采样。值为 0.0 表示不对任何跟踪进行采样。(默认:
1.0)
- mlflow.environment_variables.MLFLOW_TRACE_TIMEOUT_CHECK_INTERVAL_SECONDS = 'MLFLOW_TRACE_TIMEOUT_CHECK_INTERVAL_SECONDS'
检查超时跟踪的频率。例如,如果此值设置为 10,MLflow 将每 10 秒检查一次超时跟踪(在后台工作进程中),并中止任何已超过超时的跟踪。仅当 MLFLOW_TRACE_TIMEOUT_SECONDS 设置为正值时,此设置才有效。
- mlflow.environment_variables.MLFLOW_TRACE_TIMEOUT_SECONDS = 'MLFLOW_TRACE_TIMEOUT_SECONDS'
跟踪可以“进行中”多长时间。当此值设置为正值并且跟踪在此时间内未完成时,它将自动中止并导出到指定的后端目标,状态为“ERROR”。
- mlflow.environment_variables.MLFLOW_TRACING_DESTINATION = 'MLFLOW_TRACING_DESTINATION'
指定发送跟踪的位置。这可以是 MLflow 实验 ID 或 Databricks Unity Catalog (UC) 架构(格式:<catalog_name>.<schema_name>)。(默认:
None(将使用活动的 MLflow 实验))
- mlflow.environment_variables.MLFLOW_TRACING_SQL_WAREHOUSE_ID = 'MLFLOW_TRACING_SQL_WAREHOUSE_ID'
指定用于与 Databricks 后端进行跟踪的 SQL warehouse ID。(默认:
None)
- mlflow.environment_variables.MLFLOW_TRACKING_AUTH = 'MLFLOW_TRACKING_AUTH'
指定用于签名 MLflow HTTP 请求的身份验证提供程序(默认:
None)。设置后,它将覆盖“Authorization”HTTP 标头。
- mlflow.environment_variables.MLFLOW_TRACKING_AWS_SIGV4 = 'MLFLOW_TRACKING_AWS_SIGV4'
指定是否应使用 AWS signature V4 对 MLflow HTTP 请求进行签名。它将覆盖(默认:
False)。设置后,它将覆盖“Authorization”HTTP 标头。有关更多信息,请参阅 https://docs.aws.amazon.com/general/latest/gr/signature-version-4.html。
- mlflow.environment_variables.MLFLOW_TRACKING_CLIENT_CERT_PATH = 'MLFLOW_TRACKING_CLIENT_CERT_PATH'
设置
requests.request函数中的cert参数,请参阅 https://requests.pythonlang.cn/en/master/api/(默认:None)
- mlflow.environment_variables.MLFLOW_TRACKING_DIR = 'MLFLOW_TRACKING_DIR'
指定跟踪 FileStore 的默认根目录。(默认:
None)
- mlflow.environment_variables.MLFLOW_TRACKING_INSECURE_TLS = 'MLFLOW_TRACKING_INSECURE_TLS'
指定是否在
requests.request函数中验证 TLS 连接,请参阅 https://requests.pythonlang.cn/en/master/api/(默认:False)。
- mlflow.environment_variables.MLFLOW_TRACKING_PASSWORD = 'MLFLOW_TRACKING_PASSWORD'
指定用于向跟踪服务器进行身份验证的密码。(默认:
None)
- mlflow.environment_variables.MLFLOW_TRACKING_SERVER_CERT_PATH = 'MLFLOW_TRACKING_SERVER_CERT_PATH'
设置
requests.request函数中的verify参数,请参阅 https://requests.pythonlang.cn/en/master/api/(默认:None)
- mlflow.environment_variables.MLFLOW_TRACKING_TOKEN = 'MLFLOW_TRACKING_TOKEN'
指定并优先设置 HTTP 请求的基本/Bearer 身份验证。(默认:
None)
- mlflow.environment_variables.MLFLOW_TRACKING_USERNAME = 'MLFLOW_TRACKING_USERNAME'
指定用于向跟踪服务器进行身份验证的用户名。(默认:
None)
- mlflow.environment_variables.MLFLOW_TRUNCATE_LONG_VALUES = 'MLFLOW_TRUNCATE_LONG_VALUES'
如果设置为 True,以下实体将被截断到其最大长度: - 参数值 - 标签值 如果设置为 False,则当实体长度超过最大长度时将引发异常。(默认:
True)
- mlflow.environment_variables.MLFLOW_UC_OSS_TOKEN = 'MLFLOW_UC_OSS_TOKEN'
指定并优先设置 UC OSS 基本/Bearer 身份验证,用于 HTTP 请求。(默认:
None)
- mlflow.environment_variables.MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC = 'MLFLOW_USE_DATABRICKS_SDK_MODEL_ARTIFACTS_REPO_FOR_UC'
在注册和加载模型到/从 Databricks UC 时使用 DatabricksSDKModelsArtifactRepository。这对于启用了 SEG(安全出口网关)的工作区是必需的,并且有助于消除与现有模型构件存储库类相关的临时范围令牌生成相关的模型泄露风险。
- mlflow.environment_variables.MLFLOW_USE_DEFAULT_TRACER_PROVIDER = 'MLFLOW_USE_DEFAULT_TRACER_PROVIDER'
True)- 类型
(默认
- mlflow.environment_variables.MLFLOW_VERSION_PROMPT_CACHE_TTL_SECONDS = 'MLFLOW_VERSION_PROMPT_CACHE_TTL_SECONDS'
/version”,在提示缓存中。在此时间后,缓存的提示将被视为陈旧,并在下次访问时刷新。设置为 0 以完全禁用缓存。(默认:
float("inf"),无限 TTL)- 类型
基于版本的提示的缓存的秒数时间到期(TTL),例如,“prompts
- mlflow.environment_variables.MLFLOW_WEBHOOK_CACHE_TTL = 'MLFLOW_WEBHOOK_CACHE_TTL'
指定 Webhook 列表缓存的秒数 TTL(默认:
60)
- mlflow.environment_variables.MLFLOW_WEBHOOK_DELIVERY_MAX_WORKERS = 'MLFLOW_WEBHOOK_DELIVERY_MAX_WORKERS'
指定 Webhook 交付线程池的最大线程数(默认:
10)
- mlflow.environment_variables.MLFLOW_WEBHOOK_REQUEST_MAX_RETRIES = 'MLFLOW_WEBHOOK_REQUEST_MAX_RETRIES'
指定 Webhook HTTP 请求的最大重试次数(默认:
3)
- mlflow.environment_variables.MLFLOW_WEBHOOK_REQUEST_TIMEOUT = 'MLFLOW_WEBHOOK_REQUEST_TIMEOUT'
指定 Webhook HTTP 请求的超时时间(秒)(默认:
30)