在 Analysis Services 中, 分区 提供加载到度量值组中的事实数据的物理存储。 会自动为每个度量值组创建单个分区,但通常会创建进一步分段数据的其他分区,从而提高处理效率,提高查询性能。
处理效率更高,因为可以在一个或多个服务器上独立并行处理分区。 查询运行速度更快,因为可以将每个分区配置为具有存储模式和聚合优化,从而缩短响应时间。 例如,为包含较新数据的分区选择 MOLAP 存储通常比 ROLAP 更快。 同样,如果按日期进行分区,包含较新数据的分区可以具有比包含较旧数据较少访问的分区更多的优化。 请注意,分区的不同存储和聚合设计将对将来的合并作产生负面影响。 在优化单个分区之前,请务必考虑合并是否是分区管理策略的重要组成部分。
注释
商业智能版和企业版中提供了对多个分区的支持。 标准版不支持多个分区。 有关详细信息,请参阅 SQL Server 2014 各个版本支持的功能。
设计分区策略时的重要注意事项
多维数据集数据的完整性依赖于在多维数据集分区之间分布的数据,这样分区之间不会复制任何数据。 从分区汇总数据时,将汇总多个分区中存在的任何数据元素,就像它们是不同的数据元素一样。 这可能会导致向最终用户提供不正确的摘要和错误数据。 例如,如果在两个分区的事实数据表中重复记录 Product X 的销售事务,则 Product X 的销售摘要可能会包括对重复事务的重复计算。
可以合并分区;可以在总体存储和数据更新策略中使用此功能。 仅当分区具有相同的存储模式和聚合设计时,才能合并分区。 若要创建适合以后合并的分区,可以在创建分区时复制另一个分区的聚合设计。 还可以在创建分区后编辑分区,以复制另一个分区的聚合设计。 还必须仔细执行合并分区,以避免在生成的分区中重复数据,这可能导致多维数据集数据不准确。
本地分区
本地分区是在一台服务器上定义、处理和存储的分区。 如果多维数据集中有大型度量值组,可能需要将它们分区出来,以便跨分区并行进行处理。 优点是并行处理提供更快的执行速度。 由于一个分区处理作业不必在另一个启动之前完成,因此它们可以并行运行。 有关详细信息,请参阅“创建和管理本地分区”(Analysis Services)。
远程分区
远程分区是在一台服务器上定义的分区,但处理并存储在另一台服务器上。 如果要跨多个服务器分配数据和元数据的存储,请使用远程分区。 通常,当你从开发过渡到生产时,正在分析的数据大小会随着时间的推移而增长多次。 使用如此大的数据块,一种可能的替代方法是将这些数据分发到多台计算机上。 这不仅仅是因为一台计算机不能保存所有数据,而是因为需要多个并行处理数据的计算机。 有关详细信息,请参阅“创建和管理远程分区”(Analysis Services)。
聚合
聚合是多维数据集数据的预计算摘要,可帮助 Analysis Services 提供快速查询响应。 可以通过设置存储限制、性能提升或任意停止聚合生成过程(运行一段时间后)来控制为度量值组创建的聚合数。 更多的聚合不一定更好。 每个新聚合都以磁盘空间和处理时间为代价。 我们建议创建聚合以获得 30% 的性能提升,然后仅在测试或体验需要时提高该数量。有关详细信息,请参阅设计聚合(Analysis Services - 多维)。
分区合并和编辑
如果两个分区使用相同的聚合设计,可以将这两个分区合并为一个分区。 例如,如果你有按月份分区的清单维度,则在每个日历月结束时,可以将该月分区与现有的年份到日期分区合并。 这样,就可以快速处理和分析当前月份分区,而当合并时,每年剩余的月份只需重新处理。 该重新处理需要更长的处理时间,并且可以不太频繁地运行。 有关管理分区合并过程的详细信息,请参阅 Analysis Services 中的合并分区(SSAS - 多维)。 若要使用多维数据集设计器中的“分区”选项卡编辑多维数据集分区,请参阅“编辑或删除分区”(Analysis Services - 多维)。
相关主题
主题 | DESCRIPTION |
---|---|
创建和管理本地分区(Analysis Services) | 包含有关如何使用筛选器或不同事实数据表对数据进行分区的信息,而无需复制数据。 |
设置分区存储(Analysis Services - 多维) | 介绍如何为分区配置存储。 |
编辑或删除分区 (Analysis Services - 多维) | 介绍如何查看和编辑分区。 |
在 Analysis Services (SSAS - 多维) 中合并分区 | 包含有关如何在不复制数据的情况下合并具有不同事实数据表或不同数据切片的分区的信息。 |
设置分区写回 | 提供有关启用分区写入权限的说明。 |
创建和管理远程分区(Analysis Services) | 介绍如何创建和管理远程分区。 |