使用 Databricks 模型服务自动查找特征

模型服务可以自动从已发布的联机存储或联机表中查找特征值。 有关创建和使用联机表的更多详细信息,请参阅使用联机表提供实时特征服务

要求

  • 该模型必须使用 FeatureEngineeringClient.log_model(适用于 Unity Catalog 的功能工程)或 FeatureStoreClient.log_model(适用于旧版工作区功能存储)进行注册,并且需要 v0.3.5 或更高版本。
  • 对于第三方在线存储,必须使用只读凭据发布在线存储。

注意

可以在部署模型之前的任何时间(包括训练模型之后)发布特征表。

自动特征查找

Azure Databricks 模型服务支持自动查找以下联机存储中的特征:

以下数据类型支持自动特征查找:

  • IntegerType
  • FloatType
  • BooleanType
  • StringType
  • DoubleType
  • LongType
  • TimestampType
  • DateType
  • ShortType
  • DecimalType
  • ArrayType
  • MapType

替代联机模型评分中的特征值

将在用于模型评分的联机存储中自动查找模型所需的所有特征(使用 FeatureEngineeringClient.log_modelFeatureStoreClient.log_model 进行了记录)。 若要在为模型评分时使用 REST API 以及模型服务替代特征值,请将这些特征值作为 API 有效负载的一部分包括在内。

注意

新的特征值必须符合基础模型的预期特征数据类型。

在推理表中保存扩充的数据帧

对于从 2025 年 2 月开始创建的终结点,可以将模型服务终结点配置为记录包含查找特征值和函数返回值的扩充数据帧。 DataFrame 将保存到服务模型的推断表中。

有关设置此配置的说明,请参阅将功能查找数据帧记录到推理表中

有关推理表的信息,请参阅用于 监视和调试模型的推理表

笔记本示例:Unity Catalog

使用 Databricks Runtime 13.3 LTS 及更高版本时,Unity Catalog 中具有主键的任何 Delta 表都可以用作特征表。 使用在 Unity Catalog 中注册的表作为特征表时,所有 Unity Catalog 功能都将自动提供给该特征表。

以下笔记本演示如何将功能发布到联机表,以实现实时处理和自动功能查找。

联机表演示笔记本

获取笔记本

此示例笔记本介绍如何将特征发布到联机存储,然后提供可自动从联机存储中查找特征的已训练模型。

第三方在线存储示例笔记本 (Unity Catalog)

获取笔记本

笔记本示例:工作区特征存储(旧版)

此示例笔记本介绍如何将特征发布到联机存储,然后提供可自动从联机存储中查找特征的已训练模型。

第三方在线商店示例笔记本(工作区功能存储)

获取笔记本