本文提供了最佳做法指南,可帮助你使用访问层来优化性能和降低成本。 若要详细了解访问层,请参阅 Blob 数据的访问层。
选择最经济高效的访问层
通过将 Blob 数据放入最经济高效的访问层,可以降低成本。 在三个专为优化数据使用成本设计的层中选择。 例如,热层的存储成本较高,但读取成本较低。 因此,如果计划频繁访问数据,则热层可能是最经济高效的选择。 如果计划不太频繁地读取数据,冷层或存档层可能最有意义,因为它会增加读取数据的成本,同时降低存储数据的成本。
若要确定最佳访问层,请尝试估计每月读取的数据百分比。 下面的图表显示了给定的不同读取百分比对每月支出的影响。
若要建模和分析使用冷存储、酷存储与存档存储的成本,请参阅 存档与冷存储和酷存储。 可以应用类似的建模技术来比较热层与冷层、寒层或存档层的成本。
将数据直接迁移到最具成本效益的访问层
提前选择最佳层可以降低成本。 如果更改已经上传的块 Blob 的存储层级,那么在第一次上传 Blob 时,需支付写入到初始层级的费用,之后还需支付写入到目标层级的费用。 如果使用生命周期管理策略更改层,则该策略需要一天才能生效,一天才能完成执行。 在层更改之前,您还需要承担在初始层存储数据的容量成本。
有关如何上传到特定访问层的指导,请参阅 设置 Blob 的访问层。
有关离线数据移动到目标层级,请参阅 Azure Data Box。
将数据移动到最具成本效益的访问层
上传数据后,您应定期对容器和 Blob 进行分析,以了解它们在生产环境中的存储、组织和使用情况。 然后,使用生命周期管理策略将数据移动到最具成本效益的层。 例如,如果放入冷层,未访问超过 30 天的数据可能更具成本效益。 请考虑存档未访问超过 180 天的数据。
若要收集遥测数据,请启用 Blob 清单报告并启用上次访问时间跟踪。 使用 Azure Synapse 或 Azure Databricks 等工具基于上次访问时间分析使用模式。 若要了解如何分析数据,请参阅以下任何文章:
层追加 Blob 和页 Blob
分析结果可能会显示未活跃使用的追加 Blob 或页 Blob。 例如,你可能具有不再读取或写入的日志文件(追加 blob 文件),但出于合规原因,你希望存储它们。 同样,你可能想要备份磁盘或磁盘快照(页 Blob)。 您还可以将这些 Blob 移动到较冷的存储层。 但是,必须先将其转换为块 Blob。
有关如何将追加 Blob 和页 Blob 转换为块 Blob 的信息,请参阅将追加 Blob 和页 Blob 转换为块 Blob。
将数据移到较冷层之前打包小文件
每次读取或写入操作都会产生费用。 若要降低读取和写入数据的成本,请考虑使用 TAR 或 ZIP 等文件格式将小文件打包成较大的文件。 文件减少会减少传输数据所需的操作次数。
下图显示了打包冷层文件的相对影响。 读取成本假设每月读取百分比为 30%。
下图显示了打包文件对存档层的相对影响。 读取成本假设每月读取百分比为 30%。
若要对打包文件的成本节省进行建模和分析,请参阅此工作簿中的“打包保存”选项卡。
小窍门
为了简化搜索和读取方案,请考虑创建一个索引,用于将打包文件路径与原始文件路径相映射,然后将这些索引作为块 Blob 存储在热层中。