模块 1:使用数据工厂创建管道

此模块需要大约 10 分钟才能完成。 你将使用管道中的复制活动,将源存储中的原始数据引入 Data Lakehouse 数据层中的表。

模块 1 中的高级步骤包括:

  1. 创建数据管道。
  2. 在管道中创建复制活动以将示例数据加载到 Data Lakehouse 中。
  3. 运行并查看复制活动的结果

先决条件

创建数据管道

  1. 登录到 Power BI。

  2. 选择屏幕左下角的默认 Power BI 图标,然后选择 Fabric

    显示数据工厂体验选项的屏幕截图。

  3. 从“工作区”选项卡中选择工作区,然后选择“+ 新建项”,然后选择 数据管道

    数据工厂起始页面的屏幕截图,其中选择了创建新数据管道的按钮。

  4. 提供管道名称。 然后选择“创建”

    显示为新管道命名的对话框屏幕截图。

在管道中创建复制活动以将示例数据加载到 Data Lakehouse

  1. 选择“复制数据助手”打开复制助手工具

    显示从新管道启动页面选择“复制数据”活动的屏幕截图。

  2. 在“ 选择数据源 ”页上,从对话框顶部的选项中选择 “示例数据 ”,然后选择 “NYC 出租车 - 绿色”。

    显示在“选择数据源”选项卡上的复制助手中选择“NYC Taxi - Green”数据的屏幕截图。

  3. 数据源预览接下来显示在 “连接到数据源” 页面上。 查看,然后选择“下一步”

    屏幕截图显示了“NYC Taxi - Green”示例数据集的预览数据。

  4. 对于复制助手的 “选择数据目标 ”步骤,请选择 Lakehouse

    显示在复制数据助手的“选择数据目标”选项卡上选择湖屋目标的屏幕截图。

  5. 输入 Lakehouse 名称,然后选择创建并连接

    显示在复制助手的“数据目标配置”页上选择“创建新湖屋”选项并提供湖屋名称的屏幕截图。

  6. 为“根文件夹”选择“表”,为“加载设置”选择“加载到新表”。 提供一个名称(在本示例中,我们将其命名为Bronze),然后选择下一步

    显示复制数据助手的“连接到数据目标”选项卡的屏幕截图,在“选择并映射到文件夹路径或表格”步骤中。

  7. 最后,在复制数据助手的“查看 + 保存”页上,查看配置。 在本教程中,请取消选中 “立即开始数据传输” 复选框,因为我们会在下一步骤中手动运行该活动。 然后选择“确定”

    显示“审阅 + 保存”页上的“复制数据助手”的屏幕截图。

运行并查看复制活动的结果

  1. 在管道编辑器中选择“运行”选项卡。 然后选择“ 运行 ”按钮,然后选择 “保存并运行”以运行复制活动。

    显示管道运行选项卡的屏幕截图,其中突出显示了“运行”按钮。

    屏幕截图显示了“保存并运行”对话框,其中突出显示了“保存并运行”按钮。

  2. 可以监视该运行,并在管道画布下方的“输出”选项卡上检查结果。 选择管道的名称以查看运行详细信息。

    显示管道“输出”选项卡中“运行详细信息”按钮的屏幕截图。

  3. 运行详细信息显示读取和写入的行数为 1,508,501。

    管道运行的“复制数据详细信息”的屏幕截图。

  4. 展开“持续时间明细”部分,查看复制活动的每个阶段的持续时间。 查看复制的详细信息后,选择“关闭”

    显示复制活动运行的持续时间明细的屏幕截图。

后续步骤

继续下一部分以创建数据流。