分類マトリックスは、予測値が実際の値と一致したかどうかを判断することで、モデルのすべてのケースをカテゴリに並べ替えます。 その後、各カテゴリのすべてのケースがカウントされ、合計がマトリックスに表示されます。 分類マトリックスは、統計モデルの評価のための標準的なツールであり、 混同行列と呼ばれることもあります。
[分類マトリックス] オプションを選択すると作成されるグラフは、指定した各予測状態の実際の値と予測値を比較します。 マトリックス内の行はモデルの予測値を表し、列は実際の値を表します。 分析で使用されるカテゴリは、誤検知、真陽性、偽陰性、真陰性です
分類マトリックスは、予測の結果を評価するための重要なツールです。これは、間違った予測の影響を簡単に理解して説明できるためです。 このマトリックスの各セルの量と割合を表示することで、モデルが正確に予測された頻度をすばやく確認できます。
このセクションでは、分類マトリックスを作成する方法と、結果を解釈する方法について説明します。
分類マトリックスについて
基本的なデータ マイニング チュートリアルの一部として作成したモデルについて考えてみましょう。 [TM_DecisionTree] モデルは、ターゲットを絞ったメーリング キャンペーンを作成するために使用され、自転車を購入する可能性が最も高い顧客を予測するために使用できます。 このモデルの期待される有用性をテストするには、結果属性 [Bike Buyer] の値が既にわかっているデータ セットを使用します。 通常は、モデルのトレーニングに使用されるマイニング構造を作成したときに確保したテスト データ セットを使用します。
可能な結果は 2 つだけです。はい (顧客は自転車を購入する可能性があります)、いいえ (顧客は自転車を購入しない可能性があります)。 したがって、結果として得られる分類マトリックスは比較的単純です。
結果の解釈
次の表に、TM_DecisionTree モデルの分類マトリックスを示します。 この予測可能な属性では、0 は No を意味し、1 は Yes を意味します。
予測 | 0 (実績) | 1 (実績) |
---|---|---|
0 | 362 | 144 |
1 | 121 | 373 |
値 362 を含む最初の結果セルは、値 0 の 真陽性 の数を示します。 0 は顧客が自転車を購入しなかったことを示しているため、この統計情報は、モデルが 362 ケースで非自転車購入者の正しい値を予測したことを示します。
その値 121 を含むセルのすぐ下のセルには、誤検出の数、つまりモデルが実際には自転車を購入しなかったにもかかわらず、購入すると予測した回数が示されています。
数値144を含むセルは、1の偽陽性の数を示します。 1 は顧客が自転車を購入したことを意味するため、この統計情報は、144 のケースでは、実際に自転車を購入したときに誰かが自転車を購入しないと予測したことを示しています。
最後に、値 373 を含むセルは、ターゲット値 1 の真陽性の数を示します。 言い換えると、373 のケースでは、モデルは誰かが自転車を購入すると正しく予測しました。
斜めに隣接するセルの値を合計することで、モデルの全体的な精度を判断できます。 1 つの対角線は正確な予測の合計数を示し、もう 1 つの対角線は誤った予測の合計数を示します。
複数の予測可能な値の使用
[Bike Buyer] ケースは、可能な値が 2 つしかないため、特に解釈が容易です。 予測可能な属性に複数の可能な値がある場合、分類マトリックスは、使用可能な実際の値ごとに新しい列を追加し、各予測値の一致数をカウントします。 次の表は、3 つの値 (0、1、2) が可能な別のモデルの結果を示しています。
予測 | 0 (実際の数値) | 1 (実績) | 2 (実績) |
---|---|---|---|
0 | 111 | 3 | 5 |
1 | 2 | 123 | 十七 |
2 | 19 | 0 | 20 |
列を追加するとレポートがより複雑に見えますが、間違った予測を行う累積コストを評価する場合は、追加の詳細が非常に役立ちます。 対角線に合計を作成したり、さまざまな行の組み合わせの結果を比較したりするには、[分類マトリックス] タブにある [コピー] ボタンをクリックして、レポートを Excel に貼り付けます。 または、SQL Server 2005 以降のバージョンをサポートする Data Mining Client for Excel などのクライアントを使用して、カウントとパーセンテージの両方を含む分類レポートを Excel で直接作成することもできます。 詳細については、「 SQL Server データ マイニング」を参照してください。
分類マトリックスに関する制限事項
分類マトリックスは、不連続の予測可能な属性でのみ使用できます。
マイニング精度チャート デザイナーの [入力選択] タブでモデルを選択するときに複数のモデルを追加できますが、[分類マトリックス] タブにはモデルごとに個別のマトリックスが表示されます。
関連コンテンツ
次のトピックでは、分類マトリックスやその他のグラフを作成および使用する方法について詳しく説明します。
トピック | リンクス |
---|---|
対象メーリング モデルのリフト チャートを作成する方法のチュートリアルを提供します。 |
基本的なデータ マイニング チュートリアル リフト チャートを使用した精度のテスト (基本的なデータ マイニング チュートリアル) |
関連するグラフの種類について説明します。 |
リフト チャート (Analysis Services - データ マイニング) 利益チャート (Analysis Services - データ マイニング) 散布図 (Analysis Services - データマイニング) |
マイニング モデルとマイニング構造に対するクロス検証の使用について説明します。 | クロス検証 (Analysis Services - データ マイニング) |
リフト チャートとその他の精度グラフを作成する手順について説明します。 | テストと検証のタスクと操作方法 (データ マイニング) |