次の方法で共有


マイニング モデルと構造をカスタマイズする

ビジネス ニーズを満たすアルゴリズムを選択したら、次の方法でマイニング モデルをカスタマイズして、結果を向上させることができます。

  • モデル内のさまざまなデータ列を使用するか、列の使用法、コンテンツ タイプ、または分離方法を変更します。

  • マイニング モデルにフィルターを作成して、モデルのトレーニングに使用されるデータを制限します。

  • データの分析に使用されたアルゴリズムを変更します。

  • しきい値、ツリー分割、およびその他の重要な条件を制御するアルゴリズム パラメーターを設定します。

このトピックでは、これらのオプションについて説明します。

モデルで使用されるデータの変更

モデルで使用するデータの列と、そのデータを使用して処理する方法に関して行う決定は、分析の結果に大きく影響します。 次のトピックでは、これらの選択肢を理解するのに役立つ情報を提供します。

特性選択の活用

Analysis Services のほとんどのデータ マイニング アルゴリズムでは、 特徴選択 と呼ばれるプロセスを使用して、モデルへの追加に最も役立つ属性のみを選択します。 列と属性の数を減らすと、モデルのパフォーマンスと品質が向上します。 使用できる機能の選択方法は、選択したアルゴリズムによって異なります。

機能の選択 (データ マイニング)

使用を変更すること

マイニング モデルに含める列と各列の使用方法を変更できます。 予想される結果が得られない場合は、入力として使用した列を例として示し、列が適切な選択肢かどうか、および次のようなデータの処理を改善するためにできることがあるかどうかを自問する必要があります。

  • 誤って数値としてラベル付けされたカテゴリ変数を識別する。

  • カテゴリを追加して属性の数を折りたたみ、相関関係を見つけやすくします。

  • 数値のビン分割または離散化の方法を変更する。

  • 一意の値が多い列、または実際にデータを参照していて、住所やミドル ネームなどの分析に役立たない列を削除する。

マイニング構造から列を物理的に削除する必要はありません。列に 無視のフラグを設定できます。 列はマイニング モデルから削除されますが、構造内の他のマイニング モデルでも使用でき、ドリルスルー クエリで参照される鉱石でも使用できます。

モデル列のエイリアスの作成

Analysis Services は、マイニング モデルを作成するときに、マイニング構造にあるのと同じ列名を使用します。 マイニング モデル内の任意の列にエイリアスを追加できます。 これにより、列の内容や使用法を簡単に理解したり、クエリを作成する際の利便性のために名前を短くしたりできます。 別名は、列のコピーを作成し、説明的な名前を付ける場合にも役立ちます。

エイリアスを作成するには、マイニング モデル列の Name プロパティを編集します。 Analysis Services では、列の ID として元の名前が引き続き使用され、 Name に入力した新しい値が列の別名になり、列の使用法の横にあるかっこで囲まれたグリッドに表示されます。

マイニングモデル列のエイリアス

この図は、マイニング構造列の複数のコピーを持つ関連モデルを示しています。すべて Income に関連しています。 構造体列の各コピーは、異なる方法で分離されています。 ダイアグラム内のモデルはそれぞれ、マイニング構造とは異なる列を使用します。ただし、モデル間で列を比較する際の便宜上、各モデルの列の名前が [Income] に変更されました。

フィルターの追加

マイニング モデルにフィルターを追加できます。 フィルターは、モデル ケース内のデータを一部のサブセットに制限する WHERE 条件のセットです。 このフィルターは、モデルのトレーニング時に使用され、必要に応じて、モデルのテスト時や精度チャートの作成時に使用できます。

フィルターを追加することで、マイニング構造を再利用できますが、データの非常に異なるサブセットに基づいてモデルを作成できます。 または、フィルターを使用して特定の行を削除し、分析の品質を向上させることができます。

詳細については、「 マイニング モデルのフィルター (Analysis Services - データ マイニング)」を参照してください。

アルゴリズムの変更

マイニング構造に追加する新しいモデルは同じデータ セットを共有しますが、異なるアルゴリズム (データでサポートされている場合) を使用するか、アルゴリズムのパラメーターを変更することで、異なる結果を得ることができます。 モデリング フラグを設定することもできます。

アルゴリズムの選択によって、得られる結果の種類が決まります。 特定のアルゴリズムのしくみ、または特定のアルゴリズムを使用してメリットを得るビジネス シナリオの一般的な情報については、「 データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。

要件と制限の説明と、各アルゴリズムがサポートするカスタマイズの詳細については、各アルゴリズムのテクニカル リファレンス トピックを参照してください。

Microsoft デシジョン ツリー アルゴリズム Microsoft タイム シリーズ アルゴリズム
Microsoft クラスタリング アルゴリズム Microsoft ニューラル ネットワーク アルゴリズム
Microsoft Naive Bayes アルゴリズム Microsoft ロジスティック回帰アルゴリズム
Microsoft アソシエーション アルゴリズム Microsoft 線形回帰アルゴリズム
Microsoft シーケンス クラスタリング アルゴリズム

アルゴリズム パラメーターのカスタマイズ

各アルゴリズムでは、アルゴリズムの動作をカスタマイズし、モデルの結果を微調整するために使用できるパラメーターがサポートされています。 各パラメーターの使用方法の説明については、次のトピックを参照してください。

各アルゴリズムの種類のトピックには、そのアルゴリズムに基づくモデルで使用できる予測関数も一覧表示されます。

プロパティ名 対象
自動周期検出 Microsoft タイム シリーズ アルゴリズム技術リファレンス
CLUSTER_COUNT Microsoft クラスタリング アルゴリズムテクニカル リファレンス

Microsoft シーケンス クラスタリング アルゴリズムテクニカル リファレンス
CLUSTER_SEED Microsoft クラスタリング アルゴリズムテクニカル リファレンス
クラスタリング方法 Microsoft クラスタリング アルゴリズムテクニカル リファレンス
複雑さペナルティ Microsoft デシジョン ツリー アルゴリズムテクニカル リファレンス

Microsoft タイム シリーズ アルゴリズム技術リファレンス
FORCE_REGRESSOR Microsoft デシジョン ツリー アルゴリズムテクニカル リファレンス

Microsoft 線形回帰アルゴリズムのテクニカル リファレンス

モデリング フラグ (データ マイニング)
予測方法 Microsoft タイム シリーズ アルゴリズム技術リファレンス
HIDDEN_NODE_RATIO Microsoft ニューラル ネットワーク アルゴリズムテクニカル リファレンス
歴史的なモデルの数 Microsoft タイム シリーズ アルゴリズム技術リファレンス
歴史的モデルのギャップ Microsoft タイム シリーズ アルゴリズム技術リファレンス
ホールドアウト割合 Microsoft ロジスティック回帰アルゴリズムテクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズムテクニカル リファレンス

注: このパラメーターは、マイニング構造に適用される保留率の値とは異なります。
HOLDOUT_SEED Microsoft ロジスティック回帰アルゴリズムテクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズムテクニカル リファレンス

注: このパラメーターは、マイニング構造に適用されるホールドアウト シード値とは異なります。
不安定性感度 Microsoft タイム シリーズ アルゴリズム技術リファレンス
最大入力属性 Microsoft クラスタリング アルゴリズムテクニカル リファレンス

Microsoft デシジョン ツリー アルゴリズムテクニカル リファレンス

Microsoft 線形回帰アルゴリズムのテクニカル リファレンス

Microsoft Naive Bayes アルゴリズムテクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズムテクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズムテクニカル リファレンス
アイテムセット数の最大値 Microsoft アソシエーション アルゴリズムテクニカル リファレンス
MAXIMUM_ITEMSET_SIZE (最大項目集合サイズ) Microsoft アソシエーション アルゴリズムテクニカル リファレンス
最大出力属性 Microsoft デシジョン ツリー アルゴリズムテクニカル リファレンス

Microsoft 線形回帰アルゴリズムのテクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズムテクニカル リファレンス

Microsoft Naive Bayes アルゴリズムテクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズムテクニカル リファレンス
最大シーケンス状態 Microsoft シーケンス クラスタリング アルゴリズムテクニカル リファレンス
最大シリーズ値 Microsoft タイム シリーズ アルゴリズム技術リファレンス
最大状態数 Microsoft クラスタリング アルゴリズムテクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズムテクニカル リファレンス

Microsoft シーケンス クラスタリング アルゴリズムテクニカル リファレンス
最大限のサポート Microsoft アソシエーション アルゴリズムテクニカル リファレンス
最低重要度 Microsoft アソシエーション アルゴリズムテクニカル リファレンス
最小アイテムセットサイズ Microsoft アソシエーション アルゴリズムテクニカル リファレンス
最小依存確率 Microsoft Naive Bayes アルゴリズムテクニカル リファレンス
最小確率 Microsoft アソシエーション アルゴリズムテクニカル リファレンス
最小シリーズ値 Microsoft タイム シリーズ アルゴリズム技術リファレンス
最小限のサポート Microsoft アソシエーション アルゴリズムテクニカル リファレンス

Microsoft クラスタリング アルゴリズムテクニカル リファレンス

Microsoft デシジョン ツリー アルゴリズムテクニカル リファレンス

Microsoft シーケンス クラスタリング アルゴリズムテクニカル リファレンス

Microsoft タイム シリーズ アルゴリズム技術リファレンス
MISSING_VALUE_SUBSTITUTION Microsoft タイム シリーズ アルゴリズム技術リファレンス
モデリングの基数 Microsoft クラスタリング アルゴリズムテクニカル リファレンス
PERIODICITY_HINT Microsoft タイム シリーズ アルゴリズム技術リファレンス
予測スムージング Microsoft タイム シリーズ アルゴリズム技術リファレンス
サンプルサイズ Microsoft クラスタリング アルゴリズムテクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズムテクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズムテクニカル リファレンス
SCORE_METHOD Microsoft デシジョン ツリー アルゴリズムテクニカル リファレンス
分割法 Microsoft デシジョン ツリー アルゴリズムテクニカル リファレンス
STOPPING_TOLERANCE Microsoft クラスタリング アルゴリズムテクニカル リファレンス

こちらもご覧ください

データ マイニング アルゴリズム (Analysis Services - データ マイニング)物理アーキテクチャ (Analysis Services - データ マイニング)