数据质量服务概念

本主题简要概述了知识管理、数据质量项目和数据质量管理方面的数据质量服务(DQS)概念。

知识管理概念

DQS 知识库是由数据专员或 IT 专业人员创建的元数据存储库,用于通过数据清理和数据匹配来提高数据质量。 DQS 知识管理包括用于创建和管理知识库的过程,无论是以计算机辅助方式还是交互方式。

知识发现

知识发现是一个计算机辅助过程,用于分析组织数据的样本,以生成有关数据的知识。 获得分析结果后,可以验证和增强知识,然后将其应用于执行数据清理、匹配和分析。 有关详细信息,请参阅 DQS 知识库和域

域管理

通过域管理过程,可以更改或增强知识发现过程生成的知识。 可以在知识库中以交互方式编辑、更新和查看知识。 知识库由包含域值及其状态、域规则、基于术语的关系和引用数据的数据域组成。 在域管理中,可以更改域属性、将引用数据附加到域、管理域规则、管理域值并输入数据关系,以及创建、删除、导入或导出域。 还可以使用聚合多个单个域的复合域。 有关详细信息,请参阅 DQS 知识库和域

匹配策略

匹配策略包含用于执行重复数据删除的匹配规则。 通过匹配策略过程,可以创建匹配规则,根据匹配结果和分析数据对其进行微调,并将策略添加到知识库。 有关详细信息,请参阅 数据匹配

引用数据服务

可以使用引用数据来验证、更正和扩充数据,并利用保证其参考数据质量的公司的服务。 可以使用 Azure 市场的服务连接到引用数据提供程序,也可以使用与提供程序的直接连接。 有关详细信息,请参阅 Reference Data Services in DQS

有关 DQS 中知识管理的详细信息,请参阅 DQS 知识库和域

数据质量项目概念

数据专员使用数据质量客户端应用程序中的数据质量项目执行数据质量操作(清理和匹配)。

数据清理

DQS 中的数据清理基于 DQS 知识库中的知识完成。 DQS 中的数据清理是一个双重过程:

  • 计算机辅助清理:DQS 使用所选知识库中的知识进行清理项目,以建议对数据源中的值进行更正/建议。

  • 交互式清理:数据专员可以执行交互式清理过程,以更改或增强计算机辅助数据清理过程提出的数据更正。 数据管理员通过使用数据清理过程标识的置信度和统计信息,或者在项目中手动输入他们自己的修改来实施这些操作。

清理数据后,数据专员可以将处理的数据导出到 SQL Server 数据库、.csv或 Excel 文件。 有关详细信息,请参阅 数据清理

数据匹配

匹配过程使数据专员能够比较数据,以便略有不同但相似的数据通过去重过程对齐。 DQS 根据知识库中包含的匹配规则执行重复数据删除;数据专员从数据质量项目中指定匹配过程的参数。 有关详细信息,请参阅 数据匹配

分析和通知

数据剖析为数据专员提供有关在运行数据质量项目时由 DQS 处理的数据进行清理或匹配活动的实时统计和信息。 数据分析可帮助你评估数据质量项目中清理和匹配活动的有效性,通知可帮助用户采取措施增强数据清理和数据匹配活动。 有关详细信息,请参阅 DQS 中的数据分析和通知

有关 DQS 中的数据质量项目的详细信息,请参阅数据质量项目(DQS)。

数据质量管理概念

DQS 管理员可以使用数据质量客户端应用程序执行各种管理任务。

活动监视

活动监视显示数据范围内执行的每个活动的状态和状态,为每个活动提供数据,并使 DQS 管理员能够控制活动。 有关详细信息,请参阅 “监视 DQS 活动”。

配置

使用“配置”选项可以:

DQS 安全性

您可以使用 SQL Server 安全机制中的角色来确保 DQS 的安全性。 有三个 DQS 角色可确定数据质量客户端应用程序中用户的访问级别:dqs_administrator、dqs_kb_editor和dqs_kb_operator。 不能使用 Data Quality 客户端应用程序向用户授予角色;它使用 SQL Server Management Studio 完成。 有关详细信息,请参阅 DQS 安全性

有关 DQS 管理的详细信息,请参阅 DQS 管理

另请参阅

Data Quality Services