了解 Azure Blob 存储生命周期
数据集具有独特的生命周期。 在生命周期的早期,人们经常访问某些数据。 但随着数据的老化,访问需求急剧下降。 有些数据在云中保持空闲状态,并且在存储后很少被访问。 有些数据在创建后的数日或者数月即会过期,还有一些数据集在其整个生存期会频繁受到读取和修改。
访问层级
Azure 存储提供了不同的访问层,允许你以最具成本效益的方式存储 Blob 对象数据。 可用的访问层包括:
- 热存储层:该联机层经过优化,可存储经常访问的数据。
- 冷存储层:该联机层经过优化,可存储不经常访问且存储至少 30 天的数据。
- 冷存储层:该联机层经过优化,可存储不经常访问且存储至少 90 天的数据。 与冷层相比,寒层的存储成本较低,访问成本较高。
- 存档存储层:该联机层经过优化,可存储极少访问、存储至少 180 天且延迟要求(以小时计)不严格的数据。
数据存储限制在帐户级别设置,不按访问层设置。 可以选择在一个层中用完所有存储配额,也可以分散用于三个层。
管理数据生命周期
Azure Blob 存储生命周期管理可提供基于规则的策略,用于将 blob 数据转移到适合的访问层,或将数据设置为在数据生命周期结束时过期。
利用生命周期管理策略,可以实现以下操作:
- 在访问 Blob 时立即将其从冷存储层转换成热存储层,以优化性能。
- 如果在一段时间内未访问或修改 Blob 的当前版本、Blob 的先前版本或 Blob 快照,可将这些对象转换为冷存储层,以优化成本。
- 在其周期结束时,删除 blob 当前版本、blob 旧版本或 blob 快照。
- 将规则应用于整个存储帐户、所选容器或 Blob 子集(使用名称前缀或 Blob 索引标记作为筛选器)。
假设某个数据集在生命周期的早期阶段频繁被访问,而两周后只是偶尔被访问。 一个月以后,该数据集很少被访问。 在这种场景下,早期阶段最适合使用热存储。 在偶尔访问阶段最适合使用冷存储。 在一个月后数据陈旧时,存档存储便是最佳的层选项。 借助生命周期管理策略规则,根据数据存在时间将其移动到适当的存储层,即可根据需要设计成本最低的解决方案。