更新日期: 2007 年 9 月 15 日
因为已经建立了**“关联”模型,您可以使用数据挖掘设计器的“挖掘模型查看器”**选项卡中的 Microsoft 关联查看器浏览该模型。 浏览模型时,您可以轻松地查看可能同时出现的产品,并可浏览项之间的关系。 还可以筛选出较弱的关联,并对新浮现的模式有一个总体的概念。
Microsoft 关联查看器包含三个选项卡:“项集”、“规则”和“依赖关系网络”。 有关此查看器的详细信息,请参阅使用 Microsoft 关联规则查看器查看挖掘模型。
“项集”选项卡
**“项集”选项卡显示与 Microsoft 关联算法发现的项集相关的三种重要信息:支持度(发生项集的事务的数量)、大小(项集中项的数量)以及项集的实际构成。 根据算法参数的设置方式,算法可以生成大量的项集。 使用“项集”**选项卡顶部的控件,可以筛选查看器,使其仅显示包含指定的最小支持度和项集大小的项集。
也可以使用**“筛选项集”框来筛选查看器中显示的项集。 例如,若要仅查看包含有关 Mountain-200 自行车信息的项集,可在“筛选项集”中输入 Mountain-200。 您将在查看器中看到,只有包含“Mountain-200”字样的项集被显示。 查看器中返回的每个项集都包含有关销售 Mountain-200 自行车事务的信息。 例如,在“支持度”**列中包含值 710 的项集表示:在所有事务中,710 个购买 Mountain-200 自行车的人也购买了 Sport-100 自行车。
“规则”选项卡
**“规则”**选项卡显示与算法发现的规则相关的以下信息。
- 概率
规则发生的可能性。 - 重要性
用于度量规则的有用性,值越高则意味着规则越有用。 只看概率可能会产生误解。 例如,如果每个事务都包含一个 x 项,规则 y 预测 x 发生的概率为 1,即 x 一定会发生。 即使规则的准确性很高,但这并未传达很多信息,因为不管 y 如何,每个事务都会包含 x。 - 规则
规则的定义。
像使用**“项集”选项卡一样,您可以筛选规则,以便仅显示最关心的规则。 例如,如果只想查看包含 Mountain-200 自行车的规则,可在“筛选规则”**框中输入 Mountain-200。 查看器将仅显示包含“Mountain-200”字样的规则。 每条规则都可以根据事务中其他项的发生情况来预测某个项的发生情况。 例如,由第一个规则可知:如果一个人购买了 Mountain-200 自行车和水壶,则此人还会购买 Mountain 水壶套的概率为 1。
“相关性网络”选项卡
使用**“相关性网络”**选项卡,可以研究模型中不同项的交互。 查看器中的每个节点表示一个项;例如,Mountain-200 = Existing 节点表示事务中存在 Mountain-200。 通过选择节点,可以使用选项卡底部的彩色图例来确定模型中的项与其他的项的相互确定关系。
滑块与规则的概率关联。 上下移动滑块可以筛选出弱关联。 例如,在**“显示”框中,选择“仅显示属性名称”**,再单击 Mountain Bottle Cage 节点。 查看器显示,Mountain 水壶套预测了水壶和 Mountain-200 自行车,而水壶和 Mountain-200 自行车也预测了 Mountain 水壶套。 这意味着,这些项有可能同时在事务中出现。 也就是说,如果某个客户购买了自行车,则他也可能会购买水壶套和水壶。