Microsoft SQL Server Analysis Services のデータ マイニング ウィザードを使用して、多次元モデルのデータを使用するマイニング構造を作成できます。 OLAP キューブに基づくマイニング モデルでは、ファクト テーブル、ディメンション、メジャー グループの列と値を分析の属性として使用できます。
新しい OLAP マイニング構造を作成するには
SQL Server Data Tools (SSDT) のソリューション エクスプローラーで、Analysis Services プロジェクトの [マイニング構造 ] フォルダーを右クリックし、[ 新しいマイニング構造 ] をクリックしてデータ マイニング ウィザードを開きます。
[ データ マイニング ウィザードへようこそ ] ページで、[ 次へ] をクリックします。
[ 定義方法の選択] ページで、[ 既存のキューブから] を選択し、[ 次へ] をクリックします。
エラーが表示された場合は、サポートされているデータ マイニング アルゴリズムの一覧を取得できません。 [プロジェクトのプロパティ ] ダイアログ ボックスを開き、多次元モデルをサポートする Analysis Services インスタンスの名前が指定されていることを確認します。 テーブル モデリングをサポートする Analysis Services のインスタンスでマイニング モデルを作成することはできません。
[ データ マイニング構造の作成 ] ページで、マイニング構造のみを作成するか、マイニング構造に 1 つの関連マイニング モデルを加えるかを決定します。 一般に、マイニング モデルを同時に作成する方が簡単であるため、必要な列を含めるメッセージが表示されます。
マイニング モデルを作成する場合は、使用するデータ マイニング アルゴリズムを選択し、[ 次へ] をクリックします。 アルゴリズムの選択方法の詳細については、「 データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。
[ ソース キューブ ディメンションの選択 ] ページの [ ソース キューブ ディメンションの選択] で、ケース データの大部分を含むディメンションを見つけます。
たとえば、顧客グループを識別しようとしている場合は、Customer ディメンションを選択できます。トランザクション間で購入を分析する場合は、インターネット販売注文の詳細ディメンションを選択できます。 このディメンションのデータのみを使用するように制限されているわけではありませんが、分析で使用する重要な属性を含める必要があります。
[次へ] をクリックします。
[ ケース キーの選択 ] ページの [ 属性] で、マイニング構造のキーとなる属性を選択し、[ 次へ] をクリックします。
通常、マイニング構造のキーとして使用する属性もディメンションのキーであり、事前に選択されます。
[ ケース レベル列の選択 ] ページの [ 関連属性とメジャー] で、マイニング構造にケース データとして追加する値を含む属性とメジャーを選択します。 [次へ] をクリックします。
[ マイニング モデル列の使用状況の指定 ] ページの [ マイニング モデル構造] で、まず予測可能な列を設定してから、入力として使用する列を選択します。
マイニング構造にデータを含めるには、左端の列のチェック ボックスをオンにします。 参照に使用する列を構造に含めることができますが、分析には使用できません。
分析で変数として属性を使用するには、[ 入力 ] 列のチェック ボックスをオンにします。
予測可能な属性に対してのみ、[ 予測 ] 列のチェック ボックスをオンにします。
キーとして指定した列は、入力または予測には使用できないことに注意してください。
[次へ] をクリックします。
[ マイニング モデル列の使用法の指定 ] ページでは、[入れ子になったテーブルの追加] と [入れ子になったテーブル] を使用して、 入れ子になったテーブル をマイニング構造に追加 および削除することもできます。
OLAP マイニング モデルでは、入れ子になったテーブルは、ケース属性を表すディメンションとの一対多リレーションシップを持つキューブ内の別のデータ セットです。 そのため、ダイアログ ボックスが開くと、ケース テーブルとして選択したディメンションに既に関連付けられているメジャー グループが事前に選択されます。 この時点で、分析に役立つ追加情報を含む別のディメンションを選択します。
たとえば、顧客を分析する場合は、[Customer] ディメンションをケース テーブルとして使用します。 入れ子になったテーブルの場合、[Sales Reason] ディメンションに含まれる購入時に顧客が引用した理由を追加できます。
入れ子になったデータを追加する場合は、2 つの列を追加する必要があります。
入れ子になったテーブルのキー: [ 入れ子になったテーブル キーの選択] ページで事前に選択する必要があります。
分析に使用する属性: [入れ子になったテーブル列を選択] ページは、入れ子になったテーブルの選択肢内のメジャーと属性の一覧を提供します。
モデルに含める各属性について、左側の列のチェック ボックスをオンにします。
この属性を分析にのみ使用する場合は、[ 入力] をオンにします。
モデルの予測可能な属性の 1 つとして列を含める場合は、[ 予測] を選択します。
構造体に含めるが、入力属性または予測可能な属性として指定しない項目は、フラグ
Ignore
を使用して構造体に追加されます。つまり、データはモデルのビルド時に処理されますが、分析では使用されず、ドリルスルーでのみ使用できます。 これは、顧客名などの詳細を含めるが、分析に使用したくない場合に便利です。
[ 完了] をクリックして、入れ子になったテーブルで動作するウィザードの部分を閉じます。 このプロセスを繰り返して、複数の入れ子になった列を追加できます。
[ 列のコンテンツとデータ型の指定 ] ページの [ マイニング モデル構造] で、各列のコンテンツ タイプとデータ型を設定します。
注
OLAP マイニング モデルでは、列に連続データまたは不連続データが含まれているかどうかを自動的に検出する 検出 機能の使用はサポートされていません。
[次へ] をクリックします。
[ ソース キューブのスライス ] ページでは、マイニング構造の作成に使用するデータをフィルター処理できます。
キューブをスライスすると、モデルの構築に使用されるデータを制限できます。 たとえば、Geography 階層でスライスし、リージョンごとに個別のモデルを構築できます。
ディメンション: ドロップダウン リストから関連するディメンションを選択します。
階層: フィルターを適用するディメンション階層のレベルを選択します。 たとえば、[Geography] ディメンションでスライスする場合は、[地域の国名] などの階層レベルを選択します。
演算子: 一覧から演算子を選択します。
フィルター式: フィルター条件として使用する値または式を入力するか、ドロップダウン リストを使用して、階層の指定されたレベルのメンバーの一覧から値を選択します。
たとえば、ディメンションとして [Geography] を選択し、階層レベルとして [Region Country Name] を選択した場合、ドロップダウン リストには、フィルター条件として使用できるすべての有効な国/地域が含まれます。 複数選択することができます。 その結果、マイニング構造内のデータは、これらの地理的領域からのキューブ データに制限されます。
パラメーター: このチェック ボックスは無視します。 このダイアログ ボックスでは、複数のキューブ フィルター処理シナリオがサポートされており、このオプションはマイニング構造の構築には関係ありません。
[次へ] をクリックします。
[ データをトレーニング セットとテスト セットに分割 する] ページで、テスト用に予約するマイニング構造データの割合を指定するか、テスト ケースの最大数を指定します。 [次へ] をクリックします。
両方の値を指定した場合、制限が組み合わされて、最も低い方の値が使用されます。
[ ウィザードの完了 ] ページで、新しい OLAP マイニング構造と初期マイニング モデルの名前を指定します。
[完了] をクリックします。
[ ウィザードの完了 ] ページには、マイニング モデル ディメンションを使用してマイニング モデル ディメンションまたはキューブを作成するオプションもあります。 これらのオプションは、次のアルゴリズムを使用して構築されたモデルでのみサポートされます。
Microsoft クラスタリング アルゴリズム
Microsoft デシジョン ツリー アルゴリズム
Microsoft アソシエーションルールアルゴリズム
マイニング モデル ディメンションの作成: このチェック ボックスをオンにし、マイニング モデル ディメンションの型名を指定します。 このオプションを使用すると、マイニング構造の構築に使用された元のキューブ内に新しいディメンションが作成されます。 このディメンションを使用してドリルダウンし、さらに分析を行うことができます。 ディメンションはキューブ内にあるため、ディメンションはケース データ ディメンションに自動的にマップされます。
マイニング モデル ディメンションを使用してキューブを作成する: このチェック ボックスをオンにし、新しいキューブの名前を指定します。 このオプションを使用すると、構造の構築に使用された既存のディメンションと、モデルからの結果を含む新しいデータ マイニング ディメンションの両方を含む新しいキューブが作成されます。