在 Azure Synapse Analytics 中使用 Spark 转换数据

中级
数据工程师
Azure Synapse Analytics

数据工程师通常需要转换大量数据。 Azure Synapse Analytics 中的 Apache Spark 池提供可用于实现此目标的分布式处理平台。

学习目标

在本模块中,您将了解如何:

  • 使用 Apache Spark 修改和保存数据帧
  • 分区数据文件以提高性能和可伸缩性。
  • 使用 SQL 转换数据

先决条件

在学习本模块之前,应熟悉 Azure Synapse Analytics 中的 Apache Spark 池。 请考虑先完成 使用 Azure Synapse Analytics 中的 Apache Spark 分析数据 模块。