新しい OLAP マイニング構造を作成する

2017-06-13

Microsoft SQL Server Analysis Services のデータマイニングウィザードを使用して、多次元モデルのデータを使用するマイニング構造を作成できます。 OLAP キューブに基づくマイニングモデルでは、ファクトテーブル、ディメンション、メジャーグループの列と値を分析の属性として使用できます。

新しい OLAP マイニング構造を作成するには

SQL Server Data Tools (SSDT) のソリューションエクスプローラーで、Analysis Services プロジェクトの [マイニング構造 ] フォルダーを右クリックし、[ 新しいマイニング構造 ] をクリックしてデータマイニングウィザードを開きます。
[ データマイニングウィザードへようこそ ] ページで、[ 次へ] をクリックします。
[ 定義方法の選択] ページで、[ 既存のキューブから] を選択し、[ 次へ] をクリックします。

エラーが表示された場合は、サポートされているデータマイニングアルゴリズムの一覧を取得できません。 [プロジェクトのプロパティ ] ダイアログボックスを開き、多次元モデルをサポートする Analysis Services インスタンスの名前が指定されていることを確認します。テーブルモデリングをサポートする Analysis Services のインスタンスでマイニングモデルを作成することはできません。
[ データマイニング構造の作成 ] ページで、マイニング構造のみを作成するか、マイニング構造に 1 つの関連マイニングモデルを加えるかを決定します。一般に、マイニングモデルを同時に作成する方が簡単であるため、必要な列を含めるメッセージが表示されます。

マイニングモデルを作成する場合は、使用するデータマイニングアルゴリズムを選択し、[ 次へ] をクリックします。アルゴリズムの選択方法の詳細については、「データマイニングアルゴリズム (Analysis Services - データマイニング)」を参照してください。
[ ソースキューブディメンションの選択 ] ページの [ ソースキューブディメンションの選択] で、ケースデータの大部分を含むディメンションを見つけます。

たとえば、顧客グループを識別しようとしている場合は、Customer ディメンションを選択できます。トランザクション間で購入を分析する場合は、インターネット販売注文の詳細ディメンションを選択できます。このディメンションのデータのみを使用するように制限されているわけではありませんが、分析で使用する重要な属性を含める必要があります。

[次へ] をクリックします。
[ ケースキーの選択 ] ページの [ 属性] で、マイニング構造のキーとなる属性を選択し、[ 次へ] をクリックします。

通常、マイニング構造のキーとして使用する属性もディメンションのキーであり、事前に選択されます。
[ ケースレベル列の選択 ] ページの [ 関連属性とメジャー] で、マイニング構造にケースデータとして追加する値を含む属性とメジャーを選択します。 [次へ] をクリックします。
[ マイニングモデル列の使用状況の指定 ] ページの [ マイニングモデル構造] で、まず予測可能な列を設定してから、入力として使用する列を選択します。
- マイニング構造にデータを含めるには、左端の列のチェックボックスをオンにします。参照に使用する列を構造に含めることができますが、分析には使用できません。
- 分析で変数として属性を使用するには、[ 入力 ] 列のチェックボックスをオンにします。
- 予測可能な属性に対してのみ、[ 予測 ] 列のチェックボックスをオンにします。
キーとして指定した列は、入力または予測には使用できないことに注意してください。

[次へ] をクリックします。
[ マイニングモデル列の使用法の指定 ] ページでは、[入れ子になったテーブルの追加] と [入れ子になったテーブル] を使用して、 入れ子になったテーブル をマイニング構造に追加 および削除することもできます。

OLAP マイニングモデルでは、入れ子になったテーブルは、ケース属性を表すディメンションとの一対多リレーションシップを持つキューブ内の別のデータセットです。そのため、ダイアログボックスが開くと、ケーステーブルとして選択したディメンションに既に関連付けられているメジャーグループが事前に選択されます。この時点で、分析に役立つ追加情報を含む別のディメンションを選択します。

たとえば、顧客を分析する場合は、[Customer] ディメンションをケーステーブルとして使用します。入れ子になったテーブルの場合、[Sales Reason] ディメンションに含まれる購入時に顧客が引用した理由を追加できます。

入れ子になったデータを追加する場合は、2 つの列を追加する必要があります。
- 入れ子になったテーブルのキー: [ 入れ子になったテーブルキーの選択] ページで事前に選択する必要があります。
- 分析に使用する属性: [入れ子になったテーブル列を選択] ページは、入れ子になったテーブルの選択肢内のメジャーと属性の一覧を提供します。
  - モデルに含める各属性について、左側の列のチェックボックスをオンにします。
  - この属性を分析にのみ使用する場合は、[ 入力] をオンにします。
  - モデルの予測可能な属性の 1 つとして列を含める場合は、[ 予測] を選択します。
  - 構造体に含めるが、入力属性または予測可能な属性として指定しない項目は、フラグ Ignoreを使用して構造体に追加されます。つまり、データはモデルのビルド時に処理されますが、分析では使用されず、ドリルスルーでのみ使用できます。これは、顧客名などの詳細を含めるが、分析に使用したくない場合に便利です。
[ 完了] をクリックして、入れ子になったテーブルで動作するウィザードの部分を閉じます。このプロセスを繰り返して、複数の入れ子になった列を追加できます。
[ 列のコンテンツとデータ型の指定 ] ページの [ マイニングモデル構造] で、各列のコンテンツタイプとデータ型を設定します。

注

OLAP マイニングモデルでは、列に連続データまたは不連続データが含まれているかどうかを自動的に検出する検出機能の使用はサポートされていません。

[次へ] をクリックします。
[ ソースキューブのスライス ] ページでは、マイニング構造の作成に使用するデータをフィルター処理できます。

キューブをスライスすると、モデルの構築に使用されるデータを制限できます。たとえば、Geography 階層でスライスし、リージョンごとに個別のモデルを構築できます。
- ディメンション: ドロップダウンリストから関連するディメンションを選択します。
- 階層: フィルターを適用するディメンション階層のレベルを選択します。たとえば、[Geography] ディメンションでスライスする場合は、[地域の国名] などの階層レベルを選択します。
- 演算子: 一覧から演算子を選択します。
- フィルター式: フィルター条件として使用する値または式を入力するか、ドロップダウンリストを使用して、階層の指定されたレベルのメンバーの一覧から値を選択します。
  
  たとえば、ディメンションとして [Geography] を選択し、階層レベルとして [Region Country Name] を選択した場合、ドロップダウンリストには、フィルター条件として使用できるすべての有効な国/地域が含まれます。複数選択することができます。その結果、マイニング構造内のデータは、これらの地理的領域からのキューブデータに制限されます。
- パラメーター: このチェックボックスは無視します。このダイアログボックスでは、複数のキューブフィルター処理シナリオがサポートされており、このオプションはマイニング構造の構築には関係ありません。
[次へ] をクリックします。
[ データをトレーニングセットとテストセットに分割 する] ページで、テスト用に予約するマイニング構造データの割合を指定するか、テストケースの最大数を指定します。 [次へ] をクリックします。

両方の値を指定した場合、制限が組み合わされて、最も低い方の値が使用されます。
[ ウィザードの完了 ] ページで、新しい OLAP マイニング構造と初期マイニングモデルの名前を指定します。
[完了] をクリックします。
[ ウィザードの完了 ] ページには、マイニングモデルディメンションを使用してマイニングモデルディメンションまたはキューブを作成するオプションもあります。これらのオプションは、次のアルゴリズムを使用して構築されたモデルでのみサポートされます。
- Microsoft クラスタリングアルゴリズム
- Microsoft デシジョンツリーアルゴリズム
- Microsoft アソシエーションルールアルゴリズム
マイニングモデルディメンションの作成: このチェックボックスをオンにし、マイニングモデルディメンションの型名を指定します。このオプションを使用すると、マイニング構造の構築に使用された元のキューブ内に新しいディメンションが作成されます。このディメンションを使用してドリルダウンし、さらに分析を行うことができます。ディメンションはキューブ内にあるため、ディメンションはケースデータディメンションに自動的にマップされます。

マイニングモデルディメンションを使用してキューブを作成する: このチェックボックスをオンにし、新しいキューブの名前を指定します。このオプションを使用すると、構造の構築に使用された既存のディメンションと、モデルからの結果を含む新しいデータマイニングディメンションの両方を含む新しいキューブが作成されます。

こちらもご覧ください

マイニング構造タスクと操作方法

次の方法で共有

新しい OLAP マイニング構造を作成する

新しい OLAP マイニング構造を作成するには

こちらもご覧ください

その他のリソース