次の方法で共有


モジュール 1: Data Factory を使用してパイプラインを作成する

このモジュールの完了には約 10 分かかります。 パイプラインのコピー アクティビティを使用して、ソース ストアから Data Lakehouse の ブロンズ データ レイヤー内のテーブルに生データを取り込みます。

モジュール 1 の大まかな手順は次のとおりです。

  1. データ パイプラインを作成します。
  2. パイプラインにコピー アクティビティを作成して、Data Lakehouse にサンプル データを読み込みます。
  3. コピー アクティビティの結果を実行して表示する

[前提条件]

データ パイプラインを作成する

  1. Power BI にサインインします。

  2. 画面の左下にある既定の Power BI アイコンを選択し、[ ファブリック] を選択します。

    Data Factory エクスペリエンスの選択を示すスクリーンショット。

  3. [ ワークスペース ] タブからワークスペースを選択し、[ + 新しい項目] を選択して、[ データ パイプライン] を選択します。

    新しいデータ パイプラインを作成するためのボタンが選択されている Data Factory のスタート ページのスクリーンショット。

  4. パイプライン名を指定します。 [作成] を選択します。

    新しいパイプラインに名前を付けるダイアログを示すスクリーンショット。

パイプラインでコピー アクティビティを作成して、Data Lakehouse にサンプル データを読み込む

  1. 「コピー データ アシスタント」 を選択して、コピー アシスタントツールを開きます。

    新しいパイプラインの開始ページからの [データのコピー] アクティビティの選択を示すスクリーンショット。

  2. [ データ ソースの選択 ] ページで、ダイアログの上部にあるオプションから [サンプル データ ] を選択し、[ NYC タクシー - 緑] を選択します。

    [データ ソースの選択] タブのコピー アシスタントでの NYC Taxi - Green データの選択を示すスクリーンショット。

  3. データ ソースのプレビューは、[データ ソースへの接続] ページの横に表示されます。 確認し、次へを選択します。

    NYC Taxi - Green サンプル データセットのプレビュー データを示すスクリーンショット。

  4. コピー アシスタントの [ データ変換先の選択 ] ステップで、 Lakehouse を選択します。

    データのコピー アシスタントの [データ 宛先の選択] タブで Lakehouse 宛先の選択を示すスクリーンショット。

  5. Lakehouse 名を入力し、[ 作成して接続] を選択します。

    コピー アシスタントの [データ変換先の構成] ページを示すスクリーンショット。[新しい Lakehouse の作成] オプションを選択し、Lakehouse 名を指定します。

  6. [ルート] フォルダー[テーブル] を選択し、[読み込み] 設定で [新しいテーブルに読み込む] を選択しますテーブル名を指定し (この例ではブロンズという名前を付けた)、[次へ] を選択します。

    データ コピー アシスタントの [フォルダー パスまたはテーブルの選択とマップ] ステップの [データ宛先に接続] タブを示すスクリーンショット。

  7. 最後に、コピー データ アシスタントの [確認と保存] ページで、構成を確認します。 このチュートリアルでは、次の手順でアクティビティを手動で実行するため、[データ転送をすぐに開始] チェック ボックスをオフにします。 次に、[OK]を選択します。

    [確認と保存] ページの [データのコピー] アシスタントを示すスクリーンショット。

コピー アクティビティの結果を実行して表示する

  1. パイプライン エディターで [ 実行] タブを選択します。 次に、[ 実行 ] ボタンを選択し、[ 保存して実行] を選択してコピー アクティビティを実行します。

    [実行] ボタンが強調表示された [パイプラインの実行] タブを示すスクリーンショット。

    [保存して実行] ボタンが強調表示されている [保存して実行] ダイアログを示すスクリーンショット。

  2. 実行を監視し、パイプライン キャンバスの下にある 出力 タブで結果を確認できます。 パイプラインの名前を選択して、実行の詳細を表示します。

    パイプラインの [出力] タブの [実行の詳細] ボタンを示すスクリーンショット。

  3. 実行の詳細には、1,508,501 行の読み取りと書き込みが表示されます。

    パイプライン実行におけるデータコピーの詳細のスクリーンショット。

  4. [期間の内訳] セクションを展開すると、Copy アクティビティの各段階の期間が表示されます。 コピーの詳細を確認した後、[閉じる] を選択します。

    コピー アクティビティの実行時間の内訳を示すスクリーンショット。

次のステップ

次のセクションに進み、データフローを作成します。

モジュール 2: Data Factory のデータフローを使用してデータを変換する