介绍

已完成

Linux 基础 Delta Lake 是 Spark 的开源存储层,可为批处理和流式处理数据启用关系数据库功能。 通过使用 Delta Lake,可以在 Spark 中实现 Data Lakehouse 体系结构,以支持基于 SQL 的数据处理语义,并支持事务和模式约束。 结果是一个分析数据存储,它提供关系数据库系统的许多优势,以及数据湖中数据文件存储的灵活性。

在本模块中,你将了解如何:

  • 描述 Delta Lake 的核心特性和功能。
  • 在 Synapse Analytics Spark 池中创建和使用 Delta Lake 表。
  • 为 Delta Lake 数据创建 Spark 目录表。
  • 使用 Delta Lake 表对数据进行流式处理。
  • 从 Synapse Analytics SQL 池查询 Delta Lake 表。

注释

Azure Synapse Analytics 池中可用的 Delta Lake 版本取决于池配置中指定的 Spark 版本。 本模块中的信息反映了随 Spark 3.1 一起安装的 Delta Lake 版本 1.0。