为结构指定测试数据集(数据挖掘基础教程)
在数据挖掘向导的最后几个屏幕上,您将把数据拆分成测试集和定型集。随后您将命名您的结构并针对模型启用钻取。
指定测试集
在创建挖掘结构时将数据分成定型集和测试集,可以立即评估以后创建的挖掘模型的准确性。有关测试集的详细信息,请参阅将数据分区为定型集和测试集(Analysis Services - 数据挖掘)。
指定测试集
在**“创建测试集”页上,将“测试数据百分比”**保留其默认值:30。
对于**“测试数据集中的最大事例数”**,请键入 1000。
单击**“下一步”**。
指定钻取
可以针对模型和结构启用钻取。该窗口中的复选框针对命名模型启用钻取,并允许您从用来为模型定型的模型事例检索详细信息。
如果基础挖掘结构也已经配置为允许进行钻取,则可以从模型事例和挖掘结构返回详细信息(其中包括挖掘模型中所不包含的列)。有关详细信息,请参阅针对挖掘模型和挖掘结构使用钻取(Analysis Services – 数据挖掘)
命名模型和结构并指定钻取
在**“完成向导”页上的“挖掘结构名称”**中,键入 Targeted Mailing。
在**“挖掘模型名称”**中,键入 TM_Decision_Tree。
选中**“允许钻取”**复选框。
查看**“预览”窗格。请注意,仅显示出那些选作“键”、“输入”或“可预测”**的列。您选择的其他列(例如,AddressLine1)不能用于生成模型,但是将在基础结构中可用,您可以在处理和部署模型之后查询这些列。
单击**“完成”**。