适用于: Databricks SQL
Databricks Runtime
ai_mask()
函数允许你调用最先进的生成式 AI 模型,以便使用 SQL 对给定文本中的指定实体进行掩码。 此函数使用通过 Databricks 基础模型API 提供的聊天模型服务端点。
要求
重要
目前可能使用的基础模型根据 Apache 2.0 许可证及版权 © Apache Software Foundation,或根据 LLAMA 3.3 社区许可证 及版权 © Meta Platforms, Inc. 获得许可。保留所有权利。 客户需负责确保遵守适用的模型许可条款。
Databricks 建议查看这些许可证,以确保遵守任何适用的条款。 如果模型在未来根据 Databricks 的内部基准表现更好,Databricks 可能会更改模型(以及本页中提供的适用许可证列表)。
- 此函数仅适用于使用基础模型 API 的 AI 函数支持的区域中的工作区。
- 此函数在 Azure Databricks SQL Classic 上不可用。
- 查看 Databricks SQL 定价页。
- 在 Databricks Runtime 15.1 及更高版本中,Databricks 笔记本(包括作为任务在 Databricks 工作流中运行的笔记本)支持此函数。
- 批处理推理工作负荷需要 Databricks Runtime 15.4 ML LTS 来提高性能。
语法
ai_mask(content, labels)
参数
-
content
:一个STRING
表达式。 -
labels
:一个ARRAY<STRING>
文本。 每个元素表示要掩码的信息类型。
返回
一个 STRING
,其中的指定信息被屏蔽。
如果 content
为 NULL
,则结果为 NULL
。
示例
> SELECT ai_mask(
'John Doe lives in New York. His email is john.doe@example.com.',
array('person', 'email')
);
"[MASKED] lives in New York. His email is [MASKED]."
> SELECT ai_mask(
'Contact me at 555-1234 or visit us at 123 Main St.',
array('phone', 'address')
);
"Contact me at [MASKED] or visit us at [MASKED]"