在 Azure Synapse Analytics 中使用 Spark 转换数据
中级
数据工程师
Azure Synapse Analytics
数据工程师通常需要转换大量数据。 Azure Synapse Analytics 中的 Apache Spark 池提供可用于实现此目标的分布式处理平台。
学习目标
在本模块中,您将了解如何:
- 使用 Apache Spark 修改和保存数据帧
- 分区数据文件以提高性能和可伸缩性。
- 使用 SQL 转换数据
先决条件
在学习本模块之前,应熟悉 Azure Synapse Analytics 中的 Apache Spark 池。 请考虑先完成 使用 Azure Synapse Analytics 中的 Apache Spark 分析数据 模块。