次の方法で共有


Azure Data Lake Analytics を Azure Synapse Analytics に移行する

Azure Data Lake Analytics は 2024 年 2 月 29 日に廃止されます。 詳細については 、このお知らせを参照してください

既に Azure Data Lake Analytics を使用している場合は、組織の Azure Synapse Analytics への移行計画を作成できます。

Microsoft は、独自のビッグ データ分析エクスペリエンスのためにデータ レイクとデータ ウェアハウスの両方を統合することを目的とした Azure Synapse Analytics を立ち上げました。 データを収集して分析し、データの非効率性を解決し、チームが連携するのに役立ちます。 さらに、Synapse と Azure Machine Learning および Power BI の統合により、組織はデータから分析情報を取得し、すべてのスマート アプリに機械学習を実行する機能が向上します。

このドキュメントでは、Azure Data Lake Analytics から Azure Synapse Analytics への移行を行う方法について説明します。

  • 手順 1:適応性を評価する
  • 手順 2:移行を準備する
  • 手順 3: データとアプリケーション ワークロードを移行する
  • 手順 4: Azure Data Lake Analytics から Azure Synapse Analytics へのカットオーバー

手順 1:適応性を評価する

  1. Azure Synapse Analytics の Apache Spark を見て、Azure Data Lake Analytics と Azure Synapse Analytics 上の Spark の主な違いを理解します。

    アイテム Azure Data Lake Analytics Synapse 上の Spark
    価格設定 解析単位時間あたり 仮想コア時間ごと
    エンジン Azure Data Lake Analytics Apache Spark
    既定のプログラミング言語 U-SQL T-SQL、Python、Scala、Spark SQL、.NET
    データ ソース Azure Data Lake Storage Azure Blob Storage、Azure Data Lake Storage
  2. 移行評価のアンケートを確認し、検討する可能性のあるリスクを一覧表示します。

手順 2:移行を準備する

  1. 移行するジョブとデータを特定します。

    • この機会に、使用しなくなったジョブをクリーンアップしてください。 すべてのジョブを一度に移行する予定がない限り、この時間を取って、段階的に移行できるジョブの論理グループを特定します。
    • データのサイズを評価し、Apache Spark データ形式を理解します。 U-SQL スクリプトを確認し、スクリプトの書き換え作業を評価し、Apache Spark コードの概念を理解します。
  2. 移行がビジネスに与える影響を決定します。 たとえば、移行中にダウンタイムを許容できるかどうかなどです。

  3. 移行計画を作成します。

手順 3: データとアプリケーションのワークロードを移行する

  1. Azure Data Lake Storage Gen1 から Azure Data Lake Storage Gen2 にデータを移行します。

    Azure Data Lake Storage Gen1 の提供終了は 2024 年 2 月になります。 公式発表を参照してください。 最初にデータを Gen2 に移行することをお勧めします。 Azure Data Lake Analytics U-SQL 開発者向けの Apache Spark データ形式を理解し、U-SQL テーブルに格納されているファイルとデータの両方を移動して、Azure Synapse Analytics からアクセスできるようにします。 移行ガイドの詳細 については、こちらをご覧ください

  2. U-SQL スクリプトを Spark に変換します。 U-SQL スクリプトを Spark に変換するには、「 Azure Data Lake Analytics U-SQL 開発者向けの Apache Spark コードの概念について」 を参照してください。

  3. ジョブ オーケストレーション パイプラインを新しい Spark プログラムに変換または再作成します。

手順 4: Azure Data Lake Analytics から Azure Synapse Analytics に移行する

アプリケーションとワークロードが安定していることを確信したら、Azure Synapse Analytics の使用を開始してビジネス シナリオを満たすことができます。 Azure Data Lake Analytics で実行されている残りのパイプラインをすべてオフにし、Azure Data Lake Analytics アカウントを廃止します。

移行評価のアンケート

カテゴリ 質問 リファレンス
移行のサイズを評価する Azure Data Lake Analytics アカウントの数はいくつですか? 使用中のパイプラインの数はいくつですか? 使用されている U-SQL スクリプトの数 移行するデータとスクリプトが多いほど、スクリプトで UDO/UDF が使用されるほど、移行が困難になります。 移行に必要な時間とリソースは、プロジェクトの規模に応じて適切に計画する必要があります。
データ ソース データ ソースのサイズは何ですか? 処理するデータ形式の種類 Azure Data Lake Analytics U-SQL 開発者向けの Apache Spark データ形式について
データ出力 後で使用できるように出力データを保持しますか? 出力データが U-SQL テーブルに保存されている場合、それを処理する方法 出力データが頻繁に使用され、U-SQL テーブルに保存される場合は、スクリプトを変更し、出力データを Spark でサポートされているデータ形式に変更する必要があります。
データ移行 ストレージ移行計画を作成しましたか? Azure Data Lake Storage を Gen1 から Gen2 に移行する
U-SQL スクリプトの変換 UDO/UDF (.NET、Python など) を使用していますか?上記の答えが 「はい」の場合、UDO/UDF のどの言語を使用し、変換中に変換に問題がありますか?フェデレーション クエリは U-SQL で使用されていますか? Azure Data Lake Analytics U-SQL 開発者向けの Apache Spark コードの概念を理解する

次のステップ