次の方法で共有


列の分布 (データ マイニング)

Microsoft SQL Server Analysis Services では、マイニング構造で列の分布を定義して、マイニング モデルを作成するときにそれらの列のデータをアルゴリズムで処理する方法に影響を与えることができます。 一部のアルゴリズムでは、列に値の一般的な分布が含まれていることがわかっている場合は、モデルを処理する前に連続列の分布を定義すると便利です。 分布を定義しない場合、アルゴリズムはデータの解釈元となる情報が少なくなるため、結果として得られるマイニング モデルでは、分布が定義された場合よりも精度の低い予測が生成される可能性があります。

Analysis Services で使用できるアルゴリズムは、次のディストリビューションの種類をサポートします。

Normal 連続列の値は、正規分布を持つヒストグラムを形成します。

正規分布を持つヒストグラム 正規分布

Log Normal 連続列の値はヒストグラムを形成し、曲線は上端で細長く、下端に向かって傾斜します。

ログ正規分布を持つヒストグラム

Uniform 連続列の値は、すべての値が等しい可能性が高いフラット曲線を形成します。

均一分布を持つ

Analysis Services が提供するアルゴリズムの詳細については、「 データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。

こちらもご覧ください

コンテンツ タイプ (データ マイニング)マイニング構造 (Analysis Services - データ マイニング)分離メソッド (データ マイニング)ディストリビューション (DMX)マイニング構造列