本主题介绍向 Data Quality Services(DQS)中的知识库添加知识的方式。 在执行数据质量操作之前,您必须了解数据。 您可以通过构建和维护数据质量知识库来获得这些知识,并将与特定类型的数据源相关的知识添加到该知识库中。 知识库是有关数据的知识存储库,可用于了解数据并维护其完整性。
知识库包含与数据源相关的数据域。 对于每个数据域,DQKB 存储所有标识的术语、拼写错误、验证和业务规则,以及可用于对数据源执行数据质量操作的引用数据。 DQS 使用此知识来识别不正确或无效的数据,或执行匹配。
可以通过以下计算机辅助或交互式方式将知识添加到知识库。
执行知识发现
知识发现分析数据质量条件的示例,然后将它获取的知识添加到知识库。 这是一个计算机辅助过程,用于标识数据不一致和语法错误,并建议对数据进行更改。 知识发现活动是一个向导,其中包含一个页面,你可以以交互方式管理域值。
管理域中的数据值
使用 DQS,你可以以交互方式更改和扩充计算机辅助知识发现活动生成的元数据。 在域管理活动中执行此作,可以在其中对特定数据值应用更改。
有关文档中的详细信息,请参阅 “更改域值”。
有关演示如何执行域管理的视频, 请单击此处。 请注意,在此视频中,你将在知识发现向导的“管理域值”页中更改域值。 还可以在域管理活动的“域值”页中执行这些步骤。
从 .dqs 文件导入知识
可以将域从 .dqs 数据文件导入到现有知识库,也可以将整个知识库从 .dqs 导入到新的知识库。 为此,首先需要将现有域或知识库导出到 .dqs 文件。 包含域的 .dqs 文件包含所有域数据;包含知识库的 .dqs 文件将包含所有知识库信息,包括域和匹配策略。
- 有关文档中的详细信息,请参阅 从 .dqs 文件导入域 或 从 .dqs 文件导入知识库。
从 Excel 文件导入知识
可以将域值从 Excel 电子表格文件导入到现有域或知识库中。 为此,必须先创建一个 Excel 电子表格,其中包含要导入的域值,并确保 Excel 安装在数据质量客户端计算机上,以便能够使用 Data Quality Client 导入值。 不能将域或知识库中的域值导出到 Excel 文件。
- 有关文档中的详细信息,请参阅 将值从 Excel 文件导入到域 或 从知识发现中的 Excel 文件导入域。
将知识从项目导入回知识库
使用知识库运行清理或匹配数据质量项目后,可以将在清理或匹配期间创建的知识导入到该知识库。 这样,便可以在项目期间保留生成的知识,并在知识库中持续生成知识。
- 有关文档中的详细信息,请参阅 将清理项目值导入域。
使用默认 DQS 知识库
DQS 配备了一个名为 DQS 数据的预建知识库,其中包含用于美国公司数据和地址数据的多个域。 此知识库可用于快速启动项目,而无需创建新的知识库。 DQS 数据知识库是只读的,但数据专员可以基于该知识库创建新的知识库。
- 有关文档中的详细信息,请参阅 使用 DQS 默认知识库。