了解 Azure Blob 存储生命周期

已完成

数据集具有独特的生命周期。 在生命周期的早期,人们经常访问某些数据。 但随着数据的老化,访问需求急剧下降。 有些数据在云中保持空闲状态,并且在存储后很少被访问。 有些数据在创建后的数日或者数月即会过期,还有一些数据集在其整个生存期会频繁受到读取和修改。

访问层级

Azure 存储提供了不同的访问层,允许你以最具成本效益的方式存储 Blob 对象数据。 可用的访问层包括:

  • 热存储层:该联机层经过优化,可存储经常访问的数据。
  • 冷存储层:该联机层经过优化,可存储不经常访问且存储至少 30 天的数据。
  • 冷存储层:该联机层经过优化,可存储不经常访问且存储至少 90 天的数据。 与冷层相比,寒层的存储成本较低,访问成本较高。
  • 存档存储层:该联机层经过优化,可存储极少访问、存储至少 180 天且延迟要求(以小时计)不严格的数据。

数据存储限制在帐户级别设置,不按访问层设置。 可以选择在一个层中用完所有存储配额,也可以分散用于三个层。

管理数据生命周期

Azure Blob 存储生命周期管理可提供基于规则的策略,用于将 blob 数据转移到适合的访问层,或将数据设置为在数据生命周期结束时过期。

利用生命周期管理策略,可以实现以下操作:

  • 在访问 Blob 时立即将其从冷存储层转换成热存储层,以优化性能。
  • 如果在一段时间内未访问或修改 Blob 的当前版本、Blob 的先前版本或 Blob 快照,可将这些对象转换为冷存储层,以优化成本。
  • 在其周期结束时,删除 blob 当前版本、blob 旧版本或 blob 快照。
  • 将规则应用于整个存储帐户、所选容器或 Blob 子集(使用名称前缀或 Blob 索引标记作为筛选器)。

假设某个数据集在生命周期的早期阶段频繁被访问,而两周后只是偶尔被访问。 一个月以后,该数据集很少被访问。 在这种场景下,早期阶段最适合使用热存储。 在偶尔访问阶段最适合使用冷存储。 在一个月后数据陈旧时,存档存储便是最佳的层选项。 借助生命周期管理策略规则,根据数据存在时间将其移动到适当的存储层,即可根据需要设计成本最低的解决方案。