在 Microsoft SQL Server 2005 Analysis Services (SSAS) 中生成数据挖掘模型时,第一步是使用 Business Intelligence Development Studio 中的数据挖掘向导创建挖掘结构。挖掘结构定义据以生成挖掘模型的数据域。
挖掘结构可以基于关系数据源或联机分析处理 (OLAP) 数据源。关系挖掘结构说明存储在关系数据库系统中的数据。OLAP 挖掘结构是使用挖掘结构所在的数据库中的 OLAP 多维数据集生成的。
有关详细信息,请参阅:设计和创建数据库、使用联机分析处理 (OLAP)
数据挖掘向导自动定义挖掘结构,并在该结构中添加一个初始挖掘模型。由于挖掘结构可以包含多个挖掘模型,因此可以使用数据挖掘设计器在该结构中添加多个挖掘模型。
以下部分提供了有关使用数据挖掘向导创建新挖掘结构的详细信息。
- 创建关系挖掘结构
- 创建 OLAP 挖掘结构
创建关系挖掘结构
关系挖掘结构可以基于可通过 OLE DB 数据源获取的任何数据。如果源数据包含在多个表中,则可使用嵌套表将其作为单个事例表馈送到向导中。
有关详细信息,请参阅嵌套表
数据挖掘向导可指导您通过以下步骤创建新挖掘模型的结构:
- 选择数据源类型,在本例中为关系数据库。
- 选择一种算法。
- 选择数据源。
- 选择事例表,以及任意嵌套表(可选)。
- 选择每个列的类型,有可预测列、输入列或键列三种类型。
- 指定列内容类型。
- 命名并保存新的挖掘结构和关联的挖掘模型。
在向导的最后一页,可以选择启用钻取。如果启用了此选项,则可在处理完模型后,浏览算法用于创建挖掘模型的数据。
有关详细信息,请参阅:数据挖掘算法、设计和创建数据库、挖掘模型列、挖掘结构列、数据类型(数据挖掘)、内容类型(数据挖掘)。
创建 OLAP 挖掘结构
OLAP 多维数据集通常包含如此多的成员和维度,以致于很难手动标识维数据集包含的模式。但是,可以通过数据挖掘技术查找其中的许多模式,然后可将从这些模式中获取的知识应用于重要的业务决策。
下表列出了几项常见的 OLAP 数据挖掘任务,说明了一些可能要应用各项任务的示例场景,并标识了要用于各项任务的数据挖掘算法。
任务 | 示例场景 | 算法 |
---|---|---|
将成员分组为分类 |
根据客户成员属性、客户购买的产品和客户支出的金额,将客户维度分段。 |
Microsoft 聚类分析算法 |
查找受关注的或异常的成员 |
根据销售额、利润、存储地点和存储量标识 Store 维度中受关注的或异常的商店。 |
Microsoft 决策树算法 |
查找受关注的或异常的单元 |
标识随时间变化而呈典型趋势的商店销售额。 |
Microsoft 时序算法 |
使用数据挖掘向导定义 OLAP 挖掘模型的初始结构。该向导将指导您完成以下过程来创建新挖掘模型的结构:
- 选择数据源类型,在本例中为多维数据集。
- 选择一种算法。
- 选择源多维数据集维度。
- 选择事例键。
- 选择事例列。
- 选择任意嵌套表。
- 选择每个列的用法,包括可预测列、输入列或键列。
- 指定列内容类型。
- 对源多维数据集切片。
- 命名并保存新的挖掘结构和关联的挖掘模型。
可以在向导的最后一页设置以下选项:
- 允许钻取
- 创建挖掘模型维度
- 使用挖掘模型维度创建多维数据集
如果启用了钻取,则可在处理完模型后,浏览算法用于创建挖掘模型的数据。
如果选择在源多维数据集中创建新数据挖掘维度,则可将数据挖掘算法在 OLAP 数据源中找到的信息包含在内。如果选择创建新多维数据集,则将根据包括该数据挖掘维度的数据库定义新多维数据集。
有关详细信息,请参阅:数据挖掘算法、挖掘模型列、挖掘结构列、数据类型(数据挖掘)、内容类型(数据挖掘)。
请参阅
概念
挖掘结构 (Analysis Services)
数据挖掘设计器
数据挖掘向导
在数据挖掘设计器中管理挖掘模型
在数据挖掘设计器中管理挖掘结构
设置挖掘模型的列属性
在挖掘结构中设置列属性