ビジネス ニーズを満たすアルゴリズムを選択したら、次の方法でマイニング モデルをカスタマイズして、結果を向上させることができます。
モデル内のさまざまなデータ列を使用するか、列の使用法、コンテンツ タイプ、または分離方法を変更します。
マイニング モデルにフィルターを作成して、モデルのトレーニングに使用されるデータを制限します。
データの分析に使用されたアルゴリズムを変更します。
しきい値、ツリー分割、およびその他の重要な条件を制御するアルゴリズム パラメーターを設定します。
このトピックでは、これらのオプションについて説明します。
モデルで使用されるデータの変更
モデルで使用するデータの列と、そのデータを使用して処理する方法に関して行う決定は、分析の結果に大きく影響します。 次のトピックでは、これらの選択肢を理解するのに役立つ情報を提供します。
特性選択の活用
Analysis Services のほとんどのデータ マイニング アルゴリズムでは、 特徴選択 と呼ばれるプロセスを使用して、モデルへの追加に最も役立つ属性のみを選択します。 列と属性の数を減らすと、モデルのパフォーマンスと品質が向上します。 使用できる機能の選択方法は、選択したアルゴリズムによって異なります。
使用を変更すること
マイニング モデルに含める列と各列の使用方法を変更できます。 予想される結果が得られない場合は、入力として使用した列を例として示し、列が適切な選択肢かどうか、および次のようなデータの処理を改善するためにできることがあるかどうかを自問する必要があります。
誤って数値としてラベル付けされたカテゴリ変数を識別する。
カテゴリを追加して属性の数を折りたたみ、相関関係を見つけやすくします。
数値のビン分割または離散化の方法を変更する。
一意の値が多い列、または実際にデータを参照していて、住所やミドル ネームなどの分析に役立たない列を削除する。
マイニング構造から列を物理的に削除する必要はありません。列に 無視のフラグを設定できます。 列はマイニング モデルから削除されますが、構造内の他のマイニング モデルでも使用でき、ドリルスルー クエリで参照される鉱石でも使用できます。
モデル列のエイリアスの作成
Analysis Services は、マイニング モデルを作成するときに、マイニング構造にあるのと同じ列名を使用します。 マイニング モデル内の任意の列にエイリアスを追加できます。 これにより、列の内容や使用法を簡単に理解したり、クエリを作成する際の利便性のために名前を短くしたりできます。 別名は、列のコピーを作成し、説明的な名前を付ける場合にも役立ちます。
エイリアスを作成するには、マイニング モデル列の Name
プロパティを編集します。 Analysis Services では、列の ID として元の名前が引き続き使用され、 Name
に入力した新しい値が列の別名になり、列の使用法の横にあるかっこで囲まれたグリッドに表示されます。
この図は、マイニング構造列の複数のコピーを持つ関連モデルを示しています。すべて Income に関連しています。 構造体列の各コピーは、異なる方法で分離されています。 ダイアグラム内のモデルはそれぞれ、マイニング構造とは異なる列を使用します。ただし、モデル間で列を比較する際の便宜上、各モデルの列の名前が [Income] に変更されました。
フィルターの追加
マイニング モデルにフィルターを追加できます。 フィルターは、モデル ケース内のデータを一部のサブセットに制限する WHERE 条件のセットです。 このフィルターは、モデルのトレーニング時に使用され、必要に応じて、モデルのテスト時や精度チャートの作成時に使用できます。
フィルターを追加することで、マイニング構造を再利用できますが、データの非常に異なるサブセットに基づいてモデルを作成できます。 または、フィルターを使用して特定の行を削除し、分析の品質を向上させることができます。
詳細については、「 マイニング モデルのフィルター (Analysis Services - データ マイニング)」を参照してください。
アルゴリズムの変更
マイニング構造に追加する新しいモデルは同じデータ セットを共有しますが、異なるアルゴリズム (データでサポートされている場合) を使用するか、アルゴリズムのパラメーターを変更することで、異なる結果を得ることができます。 モデリング フラグを設定することもできます。
アルゴリズムの選択によって、得られる結果の種類が決まります。 特定のアルゴリズムのしくみ、または特定のアルゴリズムを使用してメリットを得るビジネス シナリオの一般的な情報については、「 データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。
要件と制限の説明と、各アルゴリズムがサポートするカスタマイズの詳細については、各アルゴリズムのテクニカル リファレンス トピックを参照してください。
アルゴリズム パラメーターのカスタマイズ
各アルゴリズムでは、アルゴリズムの動作をカスタマイズし、モデルの結果を微調整するために使用できるパラメーターがサポートされています。 各パラメーターの使用方法の説明については、次のトピックを参照してください。
各アルゴリズムの種類のトピックには、そのアルゴリズムに基づくモデルで使用できる予測関数も一覧表示されます。
こちらもご覧ください
データ マイニング アルゴリズム (Analysis Services - データ マイニング)物理アーキテクチャ (Analysis Services - データ マイニング)