创建新的挖掘结构

在 Microsoft SQL Server 2005 Analysis Services (SSAS) 中生成数据挖掘模型时,第一步是使用 Business Intelligence Development Studio 中的数据挖掘向导创建挖掘结构。挖掘结构定义据以生成挖掘模型的数据域。

挖掘结构可以基于关系数据源或联机分析处理 (OLAP) 数据源。关系挖掘结构说明存储在关系数据库系统中的数据。OLAP 挖掘结构是使用挖掘结构所在的数据库中的 OLAP 多维数据集生成的。

有关详细信息,请参阅:设计和创建数据库使用联机分析处理 (OLAP)

数据挖掘向导自动定义挖掘结构,并在该结构中添加一个初始挖掘模型。由于挖掘结构可以包含多个挖掘模型,因此可以使用数据挖掘设计器在该结构中添加多个挖掘模型。

以下部分提供了有关使用数据挖掘向导创建新挖掘结构的详细信息。

  • 创建关系挖掘结构
  • 创建 OLAP 挖掘结构

创建关系挖掘结构

关系挖掘结构可以基于可通过 OLE DB 数据源获取的任何数据。如果源数据包含在多个表中,则可使用嵌套表将其作为单个事例表馈送到向导中。

有关详细信息,请参阅嵌套表

数据挖掘向导可指导您通过以下步骤创建新挖掘模型的结构:

  1. 选择数据源类型,在本例中为关系数据库。
  2. 选择一种算法。
  3. 选择数据源。
  4. 选择事例表,以及任意嵌套表(可选)。
  5. 选择每个列的类型,有可预测列、输入列或键列三种类型。
  6. 指定列内容类型。
  7. 命名并保存新的挖掘结构和关联的挖掘模型。

在向导的最后一页,可以选择启用钻取。如果启用了此选项,则可在处理完模型后,浏览算法用于创建挖掘模型的数据。

有关详细信息,请参阅:数据挖掘算法设计和创建数据库挖掘模型列挖掘结构列数据类型(数据挖掘)内容类型(数据挖掘)

创建 OLAP 挖掘结构

OLAP 多维数据集通常包含如此多的成员和维度,以致于很难手动标识维数据集包含的模式。但是,可以通过数据挖掘技术查找其中的许多模式,然后可将从这些模式中获取的知识应用于重要的业务决策。

下表列出了几项常见的 OLAP 数据挖掘任务,说明了一些可能要应用各项任务的示例场景,并标识了要用于各项任务的数据挖掘算法。

任务 示例场景 算法

将成员分组为分类

根据客户成员属性、客户购买的产品和客户支出的金额,将客户维度分段。

Microsoft 聚类分析算法

查找受关注的或异常的成员

根据销售额、利润、存储地点和存储量标识 Store 维度中受关注的或异常的商店。

Microsoft 决策树算法

查找受关注的或异常的单元

标识随时间变化而呈典型趋势的商店销售额。

Microsoft 时序算法

使用数据挖掘向导定义 OLAP 挖掘模型的初始结构。该向导将指导您完成以下过程来创建新挖掘模型的结构:

  1. 选择数据源类型,在本例中为多维数据集。
  2. 选择一种算法。
  3. 选择源多维数据集维度。
  4. 选择事例键。
  5. 选择事例列。
  6. 选择任意嵌套表。
  7. 选择每个列的用法,包括可预测列、输入列或键列。
  8. 指定列内容类型。
  9. 对源多维数据集切片。
  10. 命名并保存新的挖掘结构和关联的挖掘模型。

可以在向导的最后一页设置以下选项:

  • 允许钻取
  • 创建挖掘模型维度
  • 使用挖掘模型维度创建多维数据集

如果启用了钻取,则可在处理完模型后,浏览算法用于创建挖掘模型的数据。

如果选择在源多维数据集中创建新数据挖掘维度,则可将数据挖掘算法在 OLAP 数据源中找到的信息包含在内。如果选择创建新多维数据集,则将根据包括该数据挖掘维度的数据库定义新多维数据集。

有关详细信息,请参阅:数据挖掘算法挖掘模型列挖掘结构列数据类型(数据挖掘)内容类型(数据挖掘)

请参阅

概念

挖掘结构 (Analysis Services)
数据挖掘设计器
数据挖掘向导
在数据挖掘设计器中管理挖掘模型
在数据挖掘设计器中管理挖掘结构
设置挖掘模型的列属性
在挖掘结构中设置列属性

其他资源

“挖掘结构”选项卡操作指南主题

帮助和信息

获取 SQL Server 2005 帮助