マイニング構造を作成するときに、外部データの列を選択し、データをモデリングに使用する方法を指定することで、マイニング構造の列を定義します。 そのため、マイニング構造列は、データ ソースからのデータのコピーよりも多く、ソースからのデータをマイニング モデルで使用する方法を定義します。 データの分離方法を決定するプロパティ、データ値の分散方法を説明するプロパティを割り当てることができます。
マイニング構造列は柔軟性と拡張性を備えて設計されています。マイニング モデルの構築に使用する各アルゴリズムでは、構造とは異なる列を使用してデータを解釈できるためです。 モデルごとに 1 つのデータ セットを持つ代わりに、1 つのマイニング構造を使用し、その中の列を使用して各モデルのデータをカスタマイズできます。
マイニング構造列の定義
構造列を定義する基本的なデータ型とコンテンツ タイプは、構造の作成に使用するデータ ソースから派生します。 マイニング構造内でこれらの設定を変更したり、モデリング フラグを設定したり、連続列の分布を設定したりすることもできます。
マイニング構造列の定義には、次の情報が含まれている必要があります。
ID: 列の一意の名前。多くの場合、名前と同じです。 これは、マイニング構造を作成した後は変更できませんが、名前は変更できます。
名前: 列の名前またはエイリアス。
コンテンツ: データが不連続か連続かを記述する列挙体。
型: 一般的なデータ型を示す列挙体。
分布: 値の予想される分布を記述する列挙体。 列が連続している場合は、ディストリビューションが含まれます。
モデリング フラグ: 欠損値などを処理する方法を示す列挙体。 モデリング フラグはマイニング モデルで定義することもできますが、モデル フラグは構造列で使用されるフラグとは異なります。
バインド: ソース データを指定するプロパティ。
サードパーティのアルゴリズムには、マイニング構造列で定義できるカスタム プロパティも含まれる場合があります。
データ マイニング構造とデータ マイニング モデルの詳細については、「 マイニング構造 (Analysis Services - データ マイニング)」を参照してください。
関連コンテンツ
マイニング構造列を定義して使用する方法の詳細については、次のトピックを参照してください。
トピック | リンクス |
---|---|
マイニング構造列の定義に使用できるデータ型について説明します。 | データ型 (データ マイニング) |
マイニング構造列に含まれるデータの種類ごとに使用できるコンテンツ タイプについて説明します。 コンテンツ タイプはデータ型に依存します。 コンテンツ タイプはモデル レベルで割り当てられ、モデルによって列データがどのように使用されるかが決まります。 | コンテンツ タイプ (データ マイニング) |
入れ子になったテーブルの概念について説明し、入れ子になったテーブルをマイニング構造列としてデータ ソースに追加する方法について説明します。 | 分類された列 (データ マイニング) |
マイニング構造列に設定して、列内の値の予想される分布を指定できる分布プロパティの一覧と説明を示します。 | 列の分布 (データ マイニング) |
分離の概念 ( ビン分割とも呼ばれます) について説明し、Analysis Services が連続する数値データを分離するために提供するメソッドについて説明します。 | 分離メソッド (データ マイニング) |
マイニング構造列に設定できるモデリング フラグについて説明します。 | モデリング フラグ (データ マイニング) |
分類された列について説明します。これは、1 つのマイニング構造列を別のマイニング構造列に関連付けるために使用できる特殊な種類の列です。 | 分類された列 (データ マイニング) |
マイニング構造列を追加および変更する方法について説明します。 | マイニング構造タスクと操作方法 |