参考数据是指在受信任的公共域或高级商业内容提供商中提供的一组准确且完整的相关或分类的全球数据(超出企业边界)。
使用数据质量服务(DQS)中的“参考数据服务”功能,您可以订阅第三方参考数据提供商,并通过对比他们的优质数据来验证,从而轻松清理和丰富您的业务数据。 可以使用来自 DQS 中的领先数据质量服务提供商的服务在清理过程中标准化、更正或扩充数据。 例如,可以对引用数据使用区域代码或邮政编码列表来验证客户的地址。
引用数据服务功能具有以下优势:
通过引用数据,可以通过将其与第三方公司保证的数据进行比较来确保数据的质量。
参考数据过程合并到 DQS 知识库构建和数据质量项目中,使你能够建立全面的数据质量过程。
支持使用来自 Azure 市场的参考数据,并直接从第三方参考数据提供商获取数据。
使用 Azure 市场的参考数据
DQS 支持使用 Azure 市场的引用数据,使内容提供程序能够通过市场提供引用数据服务。 Marketplace 是来自微软的一个服务,它提供了一个集成的市场和交付渠道,用于以云服务的形式提供高质量的数据和应用程序。 有关市场的详细信息,请参阅 “了解 Azure 市场”。
市场与 DQS 之间的无缝集成简化了从 DQS 内发现、浏览和获取数据质量项目的信息相关的步骤。 数据从 DQS 获取,并通过创新方式将 DQS、市场和引用数据服务提供商结合在一起,帮助 DQS 用户实现高数据质量。
若要在 DQS 中使用市场中的引用数据进行清理活动,必须具有市场帐户密钥。 创建市场帐户密钥是免费的,并且仅在订阅付费数据集时才付费。 订阅和使用免费数据集不收取任何费用。 有关创建市场帐户密钥的详细信息,请参阅 “创建帐户 ”(https://go.microsoft.com/fwlink/?LinkId=212936)。
此外,还可以从 DQS 中执行以下市场活动:
在市场平台中浏览数据集。
创建市场帐户密钥。
管理您的Marketplace账户详细信息,例如账户密钥和数据提供商的订阅。
可以在数据质量客户端的“配置”屏幕的“引用数据”选项卡中执行这些活动。
直接从第三方引用数据提供程序使用引用数据
如果没有连接到 Internet,因而无法使用在线市场,DQS 还支持直接与组织网络内可用的数据提供者连接。 若要使用来自直接联机第三方引用数据提供程序的引用数据,必须在 DQS 中创建数据提供程序的记录。
如何使用引用数据清理数据
使用引用数据清理 DQS 中的数据包括以下三个步骤:
在 DQS 中配置引用数据提供程序详细信息:在 DQS 中使用引用数据之前,必须在 DQS 中配置引用数据服务详细信息。
如果使用 Marketplace 服务,请提供有效的 Marketplace 帐户密钥,浏览到 Marketplace 中的 数据质量服务 数据类别,并订阅所需的提供程序。
如果使用直接联机引用数据提供程序,则必须在 DQS 中添加直接引用数据提供程序详细信息,然后才能使用它。
在 DQS 中配置引用数据提供程序的详细信息对于特定数据提供者是一项一次性操作。 只有 DQS 管理员可以在 DQS 中配置引用数据设置。
将知识库中的域/复合域映射到引用数据服务:将域/复合域映射到步骤 1 中订阅/添加的相应引用数据服务。
对数据质量项目中的清理活动使用映射域:为 清理 活动创建数据质量项目时,请选择包含与步骤 2 中引用数据服务映射的域/复合域的知识库,并执行清理活动。
相关任务
任务说明 | 主题 |
---|---|
介绍如何将 DQS 配置为使用来自数据市场或直接第三方在线数据服务提供商的参考数据服务。 | 配置 DQS 以使用引用数据 |
介绍如何将知识库中的域/复合域映射到引用数据服务。 | 将域或复合域附加到引用数据 |
介绍如何使用引用数据服务清理数据。 | 通过外部知识引用数据清洗数据 |