次の方法で共有


専用 SQL プールにデータを取り込む

この記事では、Azure Data Lake Gen 2 ストレージ アカウントから Azure Synapse Analytics の専用 SQL プールにデータを取り込む方法について説明します。

前提条件

  • Azure サブスクリプション:Azure サブスクリプションをお持ちでない場合は、開始する前に無料の Azure アカウントを作成してください。
  • Azure ストレージ アカウント: ソース データ ストアとして Azure Data Lake Storage Gen 2 を使用します。 ストレージ アカウントをお持ちでない場合は、 Azure Storage アカウントを作成する 手順に関するページを参照してください。
  • Azure Synapse Analytics: シンク データ ストアとして専用 SQL プールを使用します。

リンクされたサービスを作成します

Azure Synapse Analytics で、リンクされたサービスとは、他のサービスへの接続情報を定義した場所です。 このセクションでは、Azure Synapse Analytics と Azure Data Lake Storage Gen2 のリンクされたサービスを追加します。

  1. Azure Synapse Analytics UX を開き、[ 管理 ] タブに移動します。
  2. [外部接続] で、 [リンクされたサービス] を選択します。
  3. リンクされたサービスを追加するには、 [新規] を選択します。
  4. リストから [Azure Data Lake Storage Gen2] タイルを選択し、 [続行] を選択します。
  5. ご利用の認証資格情報を入力します。 アカウント キー、サービス プリンシパル、およびマネージド ID は、現在サポートされている認証の種類です。 テスト接続を選択して、資格情報が正しいことを確認します。 入力し終えたら [作成] を選択します。
  6. 手順 3 から 5 を繰り返しますが、Azure Data Lake Storage Gen2 ではなく、Azure Synapse Analytics タイルを選択し、対応する接続資格情報を入力します。 Azure Synapse Analytics では、SQL 認証、マネージド ID、サービス プリンシパルが現在サポートされています。

パイプラインの作成

パイプラインには、一連のアクティビティを実行するための論理フローが含まれています。 このセクションでは、ADLS Gen2 から専用 SQL プールにデータを取り込むコピー アクティビティを含むパイプラインを作成します。

  1. [ 統合 ] タブに移動します。パイプライン ヘッダーの横にあるプラス アイコンを選択し、[パイプライン] を選択 します
  2. [アクティビティ] ウィンドウの [ 移動と変換 ] で、[ データのコピー ] をパイプライン キャンバスにドラッグします。
  3. コピー アクティビティを選択し、[ ソース ] タブに移動します。 [新規 ] を選択して新しいソース データセットを作成します。
  4. データ ストアとして Azure Data Lake Storage gen2 を選択し、[続行] を選択します。
  5. 形式として [区切りテキスト] を選択し、[続行] を選択します。
  6. [プロパティの設定] ウィンドウで、作成した ADLS のリンクされたサービスを選択します。 ソース データのファイル パスを指定し、最初の行にヘッダーがあるかどうかを指定します。 ファイル ストアまたはサンプル ファイルからスキーマをインポートできます。 終わったら [OK] を選択します。
  7. [ シンク ] タブに移動します。[ 新規 ] を選択して新しいシンク データセットを作成します。
  8. データ ストアとして Azure Synapse Analytics を選択し、[続行] を選択します。
  9. [プロパティの設定] ウィンドウで、作成した Azure Synapse Analytics のリンクされたサービスを選択します。 既存のテーブルに書き込む場合は、ドロップダウンから選択します。 それ以外の場合は、[ 編集] を オンにして、新しいテーブル名を入力します。 完了したら [OK] を選択します
  10. テーブルを作成する場合は、テーブル オプション フィールドで [テーブルの自動作成 ] を有効にします。

パイプラインのデバッグと発行

パイプラインの構成が完了したら、成果物を発行する前にデバッグ実行を実行して、すべてが正しいことを確認できます。

  1. パイプラインをデバッグするには、ツール バーで [デバッグ] を選択します。 ウィンドウ下部の [出力] タブにパイプラインの実行の状態が表示されます。
  2. パイプラインが正常に実行されたら、上部のツール バーで [ すべて発行] を選択します。 このアクションにより、作成したエンティティ (データセットとパイプライン) が Synapse Analytics サービスに発行されます。
  3. [正常に発行されました] というメッセージが表示されるまで待機します。 通知メッセージを表示するには、右上にあるベル ボタンを選択します。

パイプラインをトリガーして監視する

この手順では、前の手順で発行したパイプラインを手動でトリガーします。

  1. ツール バーの [トリガーの追加] を選択し、 [Trigger Now](今すぐトリガー) を選択します。 [ パイプラインの実行 ] ページで、[ 完了] を選択します。
  2. 左側のサイドバーにある [モニター ] タブに移動します。 手動トリガーによって開始されたパイプラインの実行が表示されます。 [アクション] 列のリンクを使用して、アクティビティの詳細を表示したりパイプラインを再実行したりできます。
  3. パイプラインの実行に関連付けられているアクティビティの実行を表示するには、[アクション] 列の [アクティビティの実行の表示] リンクを選択します。 この例では、アクティビティが 1 つだけなので、一覧に表示されるエントリは 1 つのみです。 コピー操作の詳細については、[アクション] 列の [詳細] リンク (眼鏡アイコン) を選択します。 上部にある [パイプラインの実行] を選択して、[パイプラインの実行] ビューに戻ります。 表示を更新するには、 [最新の情報に更新] を選択します。
  4. データが専用 SQL プールに正しく書き込まれているかどうかを確認します。

次のステップ

Azure Synapse Analytics のデータ統合の詳細については、Azure Data Lake Storage Gen2 へのデータの取り込みの記事を 参照してください。