EDIT_DISTANCE_SIMILARITY(Transact-SQL) 预览版

适用于:SQL Server 2025 (17.x) 在Microsoft Fabric 中预览 Azure SQL 数据库Azure SQL 托管实例 SQL 数据库

注释

作为预览版功能,本文中介绍的技术受制于 Microsoft Azure 预览版补充使用条款

计算从 0(表示不匹配)到 100(表示完全匹配)的相似性值。

注释

  • EDIT_DISTANCE_SIMILARITY目前为预览版。
  • SQL Server 2025 (17.x) 预览版中引入EDIT_DISTANCE_SIMILARITY的 SQL Server 支持。

语法

EDIT_DISTANCE_SIMILARITY (
    character_expression,
    character_expression
)  

论据

character_expression

字符数据的字母数字表达式。 character_expression 可以是常量、变量或列。 字符表达式的类型不能为 varchar(max)nvarchar(max)。

返回类型

int

注解

此函数实现 Damerau-Levenshtein 算法。 如果任一输入为 NULL,则该函数将返回 NULL 值。 否则,该函数返回一个介于 0 到 100 的整数值。 相似性值计算为 (1 – (edit_distance / greatest(len(string1), len(string2)))) * 100.

示例:

下面的示例比较两个单词,并将该值作为列返回 EDIT_DISTANCE_SIMILARITY() ,命名 Distance

SELECT 'Colour' AS WordUK, 
       'Color' AS WordUS, 
       EDIT_DISTANCE_SIMILARITY('Colour', 'Color') AS Distance;

返回:

WordUK WordUS Distance
------ ------ -----------
Colour Color  83

有关其他示例,请参阅示例EDIT_DISTANCE_SIMILARITY()。