サーバーレス SQL プールでは、Apache Spark からメタデータを自動的に同期できます。 サーバーレスの Apache Spark プールに存在するデータベースごとに、サーバーレス SQL プール データベースが作成されます。
Parquet または CSV に基づいて Azure Storage に配置された Spark 外部テーブルごとに、サーバーレス SQL プール データベースに外部テーブルが作成されます。 そのため、Spark プールをシャットダウンしても、サーバーレス SQL プールから Spark 外部テーブルに対してクエリを実行できます。
Spark でテーブルがパーティション分割されている場合、ストレージ内のファイルはフォルダー別に整理されます。 サーバーレス SQL プールはパーティション メタデータを使用し、クエリに関連するフォルダーとファイルのみを対象とします。
メタデータ同期は、Azure Synapse ワークスペースにプロビジョニングされたサーバーレス Apache Spark プールごとに自動的に構成されます。 Spark 外部テーブルのクエリをすぐに開始できます。
Azure Storage にある各 Spark Parquet または CSV 外部テーブルは、サーバーレス SQL プール データベースに対応する dbo スキーマ内の外部テーブルで表されます。
Spark 外部テーブル クエリの場合は、外部 [spark_table] を対象とするクエリを実行します。 次の例を実行する前に、ファイルが配置されている ストレージ アカウントに正しいアクセス権 があることを確認してください。
SELECT * FROM [db].dbo.[spark_table]
Apache Spark データ型から SQL データ型へのマッピング
Apache Spark データ型と SQL データ型のマッピングの詳細については、 Azure Synapse Analytics 共有メタデータ テーブルに関するページを参照してください。
次のステップ
ストレージ アクセス制御の詳細については、 ストレージ アクセス制御 に関する記事に進んでください。