はじめに
Delta Lake Linux 基盤は、バッチ データとストリーミング データのリレーショナル データベース機能を有効にする Spark 用のオープンソース ストレージ レイヤーです。 Delta Lake を使用すると、data lakehouse アーキテクチャを Spark に実装して、トランザクションとスキーマの適用をサポートするSQL_basedデータ操作セマンティクスをサポートできます。 その結果、データ レイク内のデータ ファイル ストレージの柔軟性を備えたリレーショナル データベース システムの多くの利点を提供する分析データ ストアが得られます。
このモジュールでは、次の方法を学習します。
- Delta Lake の主要な特徴と機能について説明する。
- Synapse Analytics Spark プールで Delta Lake テーブルを作成して使用します。
- Delta Lake データ用の Spark カタログ テーブルを作成する。
- ストリーミング データに Delta Lake テーブルを使う。
- Synapse Analytics SQL プールから Delta Lake テーブルにクエリを実行します。
注
Azure Synapse Analytics プールで使用できる Delta Lake のバージョンは、プール構成で指定された Spark のバージョンによって異なります。 このモジュールの情報には、Spark 3.1 と共にインストールされている Delta Lake バージョン 1.0 が反映されています。