将数据加载到 Azure SQL
- 10 分钟
部署、验证和配置数据库或实例后,下一个逻辑步骤是引入数据。
选项
许多选项可用于将数据加载到 Azure SQL。 有些选项与本地提供的选项有所重叠。 本单元只重点介绍其中几个选项。
大容量复制程序
大容量复制程序 (bcp) 是一种常用工具,用于从本地连接到 Azure SQL,以及从 Azure 虚拟机连接到 Azure SQL。 然后可使用它将数据移动到 Azure SQL 中。
大容量插入
大容量插入操作类似于本地 SQL Server 中的操作,但不从计算机上的文件或多个文件加载数据,而是从 Azure Blob 存储加载数据。 下一个练习将通过一个示例来演示。
SSIS 包
在 Azure SQL 中,可使用包连接到本地 SQL Server Integration Services (SSIS)。 可以在 Azure SQL 数据库或 Azure SQL 托管实例中托管 SSIS 数据库。 此外,还可使用 Azure 数据工厂等工具将 Azure-SSIS Integration Runtime 用于 SSIS 包。
其他选项
其他有趣的选项包括,使用 Spark 或 Azure 数据工厂等技术将数据加载到 Azure SQL 数据库或 Azure SQL 托管实例。 虽然与加载并不直接相关,但可使用现有数据库来创建数据库,以进行复制或导入 BACPAC 文件。 在 Azure SQL 托管实例中,你可使用 T-SQL 命令从 URL 本机还原数据库。
有关加载数据的注意事项
将数据加载到本地与将数据加载到 Azure SQL 中的最大区别在于,对于后者,要加载的数据需要在 Azure 中托管。 数据不能托管在本地文件中。 可以将本地文件和文件系统存储在 Azure Blob 存储中作为备用项。 此策略还将提高在其中加载文件和设置 ETL 作业的效率。
还需记住,不支持最小日志记录,因此始终以完全恢复模式运行。 由于完整恢复模式和日志吞吐量限制,在加载数据时,可能会受日志治理的影响。 在大容量加载期间,使用批处理并适当地调整它们的大小非常重要。 在下个练习中,你将看到更多提示。 加载到聚集列存储索引中可能有助于避免事务日志限制,具体取决于你的方案。