論理アーキテクチャ (Analysis Services - データマイニング)

2017-04-27

データマイニングは、複数のコンポーネントの相互作用を伴うプロセスです。

トレーニング、テスト、または予測に使用する SQL Server データベースまたはその他のデータソース内のデータソースにアクセスします。
SQL Server Data Tools (SSDT) または Visual Studio を使用して、データマイニング構造とモデルを定義します。
SQL Server Management Studio を使用して、データマイニングオブジェクトを管理し、予測とクエリを作成します。
ソリューションが完了したら、Analysis Services のインスタンスにデプロイします。

これらのソリューションオブジェクトを作成するプロセスは、既に他の場所で説明されています。詳細については、「データマイニングソリューション」を参照してください。

データマイニングのソースデータ

データマイニングで使用するデータは、データマイニングソリューションには格納されません。バインディングのみが格納されます。データは、以前のバージョンの SQL Server、CRM システム、またはフラットファイルで作成されたデータベースに存在する可能性があります。処理によって構造またはモデルをトレーニングすると、データの統計要約が作成され、後の操作で使用するために保持したり、処理後に削除したりできるキャッシュに格納されます。詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

Analysis Services データソースビュー (DSV) オブジェクト内の異なるデータを組み合わせると、データソースの上に抽象化レイヤーが提供されます。テーブル間の結合を指定したり、多対一リレーションシップを持つテーブルを追加して入れ子になったテーブル列を作成したりできます。これらのオブジェクト (データソースとデータソースビュー) の定義は、ファイル名拡張子 *.ds と *.dsv を使用してソリューション内に格納されます。 Analysis Services データソースとデータソースビューの作成と使用の詳細については、「サポートされるデータソース (SSAS 多次元)」を参照してください。

AMO または XMLA を使用して、データソースとデータソースビューを定義および変更することもできます。これらのオブジェクトをプログラムで操作する方法の詳細については、「論理アーキテクチャの概要 (Analysis Services - 多次元データ)」を参照してください。

マイニング構造

データマイニング構造は、マイニングモデルの構築元となるデータドメインを定義する論理データコンテナーです。 1 つのマイニング構造で複数のマイニングモデルをサポートできます。

データマイニングソリューションでデータを使用する必要がある場合、Analysis Services はソースからデータを読み取り、集計やその他の情報のキャッシュを生成します。既定では、このキャッシュは保持されるため、トレーニングデータを再利用して追加のモデルをサポートできます。キャッシュを削除する必要がある場合は、マイニング構造オブジェクトの CacheMode プロパティを値 ClearAfterProcessingに変更します。詳細については、「 AMO データマイニングクラス」を参照してください。

SQL Server 2014 Analysis Services (SSAS) には、データをトレーニングデータセットとテストデータセットに分割する機能も用意されているため、代表的なランダムに選択されたデータセットでマイニングモデルをテストできます。データは実際には個別に格納されません。むしろ、構造体キャッシュ内のケースデータは、その特定のケースがトレーニングまたはテストに使用されるかどうかを示すプロパティでマークされます。キャッシュが削除された場合、その情報は取得できません。

詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

データマイニング構造には、入れ子になったテーブルを含めることができます。入れ子になったテーブルは、プライマリデータテーブルでモデル化されるケースに関する詳細を提供します。詳細については、「ネストされたテーブル (Analysis Services - データマイニング)」を参照してください。

マイニングモデル

処理の前に、データマイニングモデルはメタデータプロパティの組み合わせにすぎません。これらのプロパティは、マイニング構造を指定し、データマイニングアルゴリズムを指定し、データの処理方法に影響を与えるパラメーターとフィルター設定のコレクションを定義します。詳細については、「マイニングモデル (Analysis Services - データマイニング)」を参照してください。

モデルを処理すると、マイニング構造キャッシュに格納されたトレーニングデータを使用して、データの統計プロパティと、アルゴリズムとそのパラメーターで定義されたヒューリスティックの両方に基づいてパターンを生成します。これはモデルの学習と呼ばれます。

トレーニングの結果は、 モデルコンテンツ内に含まれる一連の概要データであり、検出されたパターンを記述し、予測を生成するためのルールを提供します。詳細については、「マイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

限られたケースでは、モデルの論理構造を、標準形式である予測モデリングマークアップ言語 (PMML) に従ってモデルの数式とデータバインディングを表すファイルにエクスポートすることもできます。この論理構造は、PMML とモデルを利用する他のシステムにインポートできるため、説明を予測に使用できます。詳細については、「 DMX Select ステートメントについて」を参照してください。

カスタムデータマイニングオブジェクト

精度グラフや予測クエリなど、データマイニングプロジェクトのコンテキストで使用するその他のオブジェクトはソリューション内に保持されませんが、ASSL を使用してスクリプト化したり、AMO を使用して構築したりできます。

さらに、Analysis Services のインスタンスで使用できるサービスと機能を拡張するには、次のカスタムオブジェクトを追加します。

カスタムアセンブリ
.NET アセンブリは、CLR または COM クレーム言語を使用して定義し、SQL Server のインスタンスに登録できます。アセンブリファイルは、アプリケーションによって定義された場所から読み込まれ、コピーがデータと共にサーバーに保存されます。アセンブリファイルのコピーは、サービスが開始されるたびにアセンブリを読み込むのに使用されます。

詳細については、「多次元モデルアセンブリ管理」を参照してください。

カスタムストアドプロシージャ
Analysis Services データマイニングでは、ストアドプロシージャを使用してデータマイニングオブジェクトを操作できます。独自のストアドプロシージャを作成して機能を拡張し、予測クエリやコンテンツクエリによって返されるデータをより簡単に操作できます。

ストアドプロシージャの定義

クロス検証の実行では、次のストアドプロシージャがサポートされています。

データマイニングストアドプロシージャ (Analysis Services - データマイニング)

さらに、Analysis Services には、データマイニングに内部的に使用される多くのシステムストアドプロシージャが含まれています。システムストアドプロシージャは内部で使用できますが、便利なショートカットが見つかる場合があります。 Microsoft は、必要に応じてこれらのストアドプロシージャを変更する権利を留保します。そのため、運用環境で使用する場合は、DMX、AMO、または XMLA を使用してクエリを作成することをお勧めします。

カスタムプラグインアルゴリズム
Analysis Services には、独自のアルゴリズムを作成し、そのアルゴリズムを新しいデータマイニングサービスとしてサーバーインスタンスに追加するためのメカニズムが用意されています。

Analysis Services では、COM インターフェイスを使用してプラグインアルゴリズムと通信します。新しいアルゴリズムを実装する方法の詳細については、「プラグインアルゴリズム」を参照してください。

使用する前に、新しいアルゴリズムを登録する必要があります。アルゴリズムを登録するには、Analysis Services のインスタンスの .ini ファイルにアルゴリズムに必要なメタデータを追加します。新しいアルゴリズムを使用する予定の各インスタンスに情報を追加する必要があります。アルゴリズムを追加したら、インスタンスを再起動し、MINING_SERVICES スキーマ行セットを使用して、アルゴリズムがサポートするオプションやプロバイダーなど、新しいアルゴリズムを表示できます。

こちらもご覧ください

多次元モデルオブジェクト処理
 データマイニング拡張機能 (DMX) リファレンス

次の方法で共有

論理アーキテクチャ (Analysis Services - データ マイニング)

データマイニングのソースデータ

マイニング構造

マイニング モデル

カスタム データ マイニング オブジェクト

こちらもご覧ください

その他のリソース

論理アーキテクチャ (Analysis Services - データマイニング)

マイニングモデル

カスタムデータマイニングオブジェクト