在实时中心添加 Azure Cosmos DB CDC 作为源

本文介绍如何在 Fabric 实时中心中添加 Azure Cosmos DB for NoSQL 变更数据捕获 (CDC) 作为事件源。

使用 Azure Cosmos DB 变更数据捕获 (CDC) 源连接器捕获 Azure Cosmos DB 数据库中当前数据的快照。 然后,连接器将监视并记录对此数据进行的任何未来的行级别更改。 在流中捕获更改后,可以实时处理此 CDC 数据,并将其发送到 Fabric 内的不同目的地,以进一步处理或分析。

先决条件

  • 在 Fabric 容量许可模式或试用许可模式下,具有“参与者”或更高权限的用户可以访问工作区。
  • 访问 Azure Cosmos DB for NoSQL 帐户和数据库。
  • Azure Cosmos DB for NoSQL 数据库必须可供公开访问,并且不能位于防火墙后面或在虚拟网络中受到保护。
  • 如果没有事件流,请创建一个事件流

从 Azure 门户获取连接详细信息

你需要从 Azure 门户收集的项目的标签在以下步骤中显示。 始终需要 https://<account>.<api>.azure.com:<port>/ 之类格式的终结点 URI、主密钥,以及要为其收集数据的数据库名称和项目 ID。

注意

Azure Cosmos DB for NoSQL CDC 使用 Azure Cosmos DB 更改源最新版本模式。 它记录最新版本中的记录更改。 请注意,此模式不会记录删除操作。

  1. 在 Azure Cosmos DB 帐户的 Azure 门户页上,选择左侧导航栏中的设置下的密钥

  2. 在“密钥”页上,复制 URI主密钥值以用于设置事件流连接。

    Azure 门户的“Azure Cosmos DB 密钥”页上 URI 和主密钥的屏幕截图。

  3. 在 Azure 门户内您 Azure Cosmos DB 帐户的“概述”页上,记下您想要收集数据的数据库和项目 ID

    Azure Cosmos DB NoSQL API 帐户的容器列表的屏幕截图。

从 Azure Cosmos DB CDC 获取事件

可以通过以下方法之一将事件从 Azure Cosmos DB CDC 获取到实时中心:

数据源页面

  1. 登录 Microsoft Fabric

  2. 如果页面左下角显示了“Power BI”,请依次选择“Power BI”和“Fabric”,切换到 Fabric 工作负载

    显示如何切换到 Fabric 工作负荷的屏幕截图。

  3. 选择左侧导航栏上的“实时”

    显示如何启动“连接到数据源”体验的屏幕截图。

  4. 实时中心页上,选择左侧导航菜单中连接到下的+ 数据源

    显示 Real-Time 中心中的“数据源”页的屏幕截图。

    还可以从“所有数据流”或“我的数据流”页面访问“数据源”页,方法是选择右上角的“+ 连接数据源”按钮。

    显示“连接数据源”按钮的屏幕截图。

使用“添加 Azure Cosmos DB CDC 作为源”部分中的说明。

Microsoft 资源页

  1. 在实时中心,选择“Microsoft 源”

  2. 在“源”下拉列表中,选择“Azure Cosmos DB (CDC)”

  3. 对于“订阅”,选择具有你的 Cosmos DB 帐户所在资源组的 Azure 订阅

  4. 请为“资源组”选择一个包含 Cosmos DB 帐户的资源组

  5. 对于区域,选择 Cosmos DB 所在的位置。

  6. 现在,在数据库列表中,将鼠标悬停在要连接到实时中心的 Cosmos DB CDC 源的名称上,并选择连接按钮,或者选择...(省略号),然后选择连接按钮。

    屏幕截图显示“Microsoft 源”页,其中包含用于显示 Cosmos DB CDC 和连接按钮的筛选器。

    若要配置连接信息,请使用“添加 Azure Cosmos DB CDC 作为源”部分中的步骤。 跳过第一步 - 在“添加源”向导中选择 Azure Cosmos DB CDC 作为源类型。

将 Azure Cosmos DB CDC 添加为源

  1. 在“连接”页上,选择“新建连接”。

    屏幕截图显示“添加源”向导中的“连接”页,其中突出显示了“新建连接”链接****。

  2. 在“连接设置”部分中,指定 Cosmos DB 终结点。 输入从 Azure 门户复制的 Cosmos DB 帐户的 URI 或终结点。

    显示“新建连接”页的“连接设置”部分的屏幕截图。

  3. 展开“高级选项”,然后按照下列步骤操作:

    1. 对于重试次数,指定如果请求因可恢复错误而失败,连接器应向 Cosmos DB 数据库重新发送请求的最大次数。

    2. 对于启用 AVERAGE 函数向下传递,指定连接器是否应将 AVG 聚合函数向下传递到 Cosmos DB 数据库。

    3. 对于启用多列排序下推,请指定当在 SQL 查询的 ORDER BY 子句中指定多列时,连接器是否应允许这些列下推到 Cosmos DB 数据库。

      显示配置 Azure Cosmos DB 连接器的高级选项的屏幕截图。

  4. 向下滚动,然后在“连接凭据”部分中,执行以下步骤。

    1. 选择现有连接并保留默认的“创建新连接”选项。
    2. 若要创建连接,请输入以下值:
      1. 对于连接名称,输入连接的名称。

      2. 对于身份验证类型,选择“帐户密钥”

      3. 对于帐户密钥,输入之前保存的密钥值。

      4. 选择“连接”。

        显示“新建连接”页的“连接凭据”部分的屏幕截图。

  5. 现在,在“连接”页上,执行以下步骤:

    1. 指定 Azure Cosmos DB 帐户中容器的容器 ID

    2. 在右侧的“流详细信息”部分中,选择要保存向导将要创建的事件流的 Fabric 工作区

    3. 对于“事件流名称”,请输入事件流的名称。 该向导会创建一个事件流,将所选的 Azure Cosmos DB CDC 作为其源。

    4. 流名称”是通过将 -stream 追加到事件流的名称中自动为你生成的。 当向导完成后,您可以在实时中心的“所有数据流”页面上查看此流。

    5. 选择下一步

      屏幕截图显示“添加源”向导中已填充的“连接”页。

  6. 在“查看 + 连接”屏幕上,查看摘要,然后选择“创建源”。

    屏幕截图显示“添加源”向导中已填充的“查看 + 连接”页。

查看数据流详细信息

  1. 在“查看 + 连接”页面上,如果选择“打开事件流”,向导会为你打开它创建的事件流,并将选定的 Azure Cosmos DB CDC 用作源。 要关闭向导,请选择页面右上角的“关闭”或 "X"*。

    显示成功创建源后“查看 + 连接”页的屏幕截图。

  2. 在“实时中心”选择“所有数据流”。 若要查看新的数据流,请刷新“所有数据流”页。

    这是一个显示“实时中心所有数据流”页面的屏幕截图,其中包含您新创建的流。

    有关详细步骤,请参阅在 Fabric 实时中心查看数据流的详细信息

若要了解有关使用数据流的信息,请参阅以下文章: