データ マイニング クエリは、多くの目的に役立ちます。 次のようにすることができます。
モデルを新しいデータに適用して、1 つまたは複数の予測を行います。 入力値は、パラメーターとして、またはバッチで指定できます。
トレーニングに使用されるデータの統計の概要を取得します。
パターンとルールを抽出するか、モデル内のパターンを表す一般的なケースのプロファイルを生成します。
回帰式と、パターンを説明するその他の計算を抽出します。
特定のパターンに適合するケースを取得します。
分析で使用されていないデータを含め、モデルで使用される個々のケースに関する詳細を取得します。
新しいデータを追加してモデルを再トレーニングするか、クロス予測を実行します。
このセクションでは、データ マイニング クエリを開始するために必要な情報の概要について説明します。 ここでは、データ マイニング オブジェクトに対して作成できるクエリの種類について説明し、クエリ ツールとクエリ言語を紹介し、SQL Server データ マイニングで提供されているアルゴリズムを使用して構築されたモデルに対して作成できるクエリの例へのリンクを示します。
データ マイニング クエリについて
Analysis Services データ マイニングでは、次の種類のクエリがサポートされています。
-
モデル内のパターンに基づいて、および入力データから推論を行うクエリ。
-
メタデータ、統計、およびモデル自体に関するその他の情報を返すクエリ。
-
モデルの基になるケース データ、またはモデルで使用されなかった構造からデータを取得できるクエリ。
-
モデルから情報を返すのではなく、モデルや構造を構築したり、モデルまたは構造体のデータを更新したりするために使用されるクエリ。
クエリを作成する前に、SQL Server によって提供される各データ マイニング アルゴリズムで作成されたモデル間の違いを理解することをお勧めします。
各アルゴリズムの種類に対して提供されるカスタム データ マイニング ビューアーを使用して、各モデルの種類を参照および探索します。 詳細については、「 マイニング モデル ビューアーのタスクと操作方法」を参照してください。
Microsoft 汎用コンテンツ ツリー ビューアーを使用して、各モデルの種類のモデル コンテンツを確認します。 この情報を解釈するには、「 マイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
クエリ ツールとインターフェイス
SQL Server で提供されているクエリ ツールのいずれかを使用して、データ マイニング クエリを対話形式で作成できます。 グラフィカル予測クエリ ビルダーは、SQL Server Data Tools (SSDT) と SQL Server Management Studio の両方で提供されます。 予測クエリ ビルダーを使用したことがない場合は、 基本的なデータ マイニング チュートリアル の手順に従って、インターフェイスについて理解することをお勧めします。 手順の簡単な概要については、「予測クエリ ビルダーを使用して 予測クエリを作成する」を使用してクエリを作成するを参照してください。
予測クエリ ビルダーは、後でカスタマイズするクエリを開始するのに役立ちます。 データ ソースを簡単に追加して列にマップした後、WHERE 句またはその他の関数を追加することで、DMX ビューに切り替えてクエリをカスタマイズできます。
データ マイニング モデルとクエリの作成方法を理解したら、データ マイニング拡張機能 (DMX) を使用してクエリを直接記述することもできます。 DMX は Transact-SQL に似たクエリ言語であり、さまざまなクライアントから使用できます。 DMX は、カスタム予測と複雑なクエリの両方を作成するための選択ツールです。 DMX の概要については、「 DMX を使用したデータ マイニング モデルの作成とクエリ: チュートリアル (Analysis Services - データ マイニング)」を参照してください。
DMX エディターは、SQL Server Data Tools (SSDT) と SQL Server Management Studio の両方で提供されます。 予測クエリ ビルダーを使用してクエリを開始し、ビューをテキスト エディターに変更し、DMX ステートメントを別のクライアントにコピーすることもできます。 詳細については、「 データ マイニング クエリ インターフェイス」を参照してください。
プログラムで DMX ステートメントを作成し、AMO または XMLA を使用してクライアントから Analysis Services サーバーに送信できます。 ただし、DMX は、マイニング モデルに対するクエリを作成するために使用する必要がある言語です。
データ マイニング スキーマ行セットに基づく動的管理ビュー (DMV) を使用して、モデルのメタデータ、統計、および一部のコンテンツに対してクエリを実行することもできます。 これらの DMV を使用すると、SELECT ステートメントを入力してモデルに関する情報を簡単に取得できます。ただし、予測を作成することはできません。 Analysis Services でサポートされる DMV の詳細については、「 動的管理ビュー (DMV) を使用して Analysis Services を監視する」を参照してください。
最後に、データ マイニング クエリ タスクまたはデータ マイニング クエリ変換を使用して、Integration Services パッケージで使用する データ マイニング クエリを作成できます。 制御フロー タスクでは複数の種類の DMX クエリがサポートされますが、データ フロー変換ではデータ フロー内のデータを操作するクエリのみがサポートされます。つまり、PREDICTION JOIN 構文を使用するクエリがサポートされます。
さまざまなモデルの種類のクエリ
モデルの作成時に使用されたアルゴリズムは、データ マイニング クエリから取得できる情報の種類に大きく影響します。 違いの理由は、各アルゴリズムが異なる方法でデータを処理し、さまざまな種類のパターンを格納するためです。 たとえば、一部のアルゴリズムではクラスターが作成されます。他のユーザーはツリーを作成します。 そのため、使用しているモデルの種類によっては、特殊な予測関数とクエリ関数を使用する必要がある場合があります。
次の一覧に、クエリで使用できる関数の概要を示します。
一般的な予測関数:
Predict
関数はポリモーフィックであり、すべてのモデル型で動作します。 この関数は、使用しているモデルの種類を自動的に検出し、追加のパラメーターの入力を求めます。 詳細については、「 予測 (DMX)」を参照してください。警告
すべてのモデルが予測に使用されるわけではありません。 たとえば、予測可能な属性を持たないクラスタリング モデルを作成できます。 ただし、モデルに予測可能な属性がない場合でも、モデルから他の種類の有用な情報を返す予測クエリを作成できます。
カスタム予測関数: 各モデルの種類には、そのアルゴリズムによって作成されたパターンを操作するために設計された一連の予測関数が用意されています。
たとえば、
Lag
関数は時系列モデルに対して提供され、モデルに使用されている履歴データを表示できます。 クラスタリング モデルの場合、ClusterDistance
などの関数の方が意味があります。各モデルの種類でサポートされる関数の詳細については、次のリンクを参照してください。
アソシエーション モデル クエリの例 Microsoft Naive Bayes アルゴリズム クラスタリング モデル クエリの例 ニューラル ネットワーク モデルクエリの例 デシジョン ツリー モデルクエリの例 シーケンス クラスタリング モデルクエリの例 線形回帰モデルクエリの例 タイム シリーズ モデル クエリの例 ロジスティック回帰モデルクエリの例 VBA 関数を呼び出したり、独自の関数を作成したりすることもできます。 詳細については、「 関数 (DMX)」を参照してください。
一般的な統計: ほぼすべてのモデル型で使用できる関数が多数あります。この関数は、標準偏差などの記述統計の標準セットを返します。
たとえば、
PredictHistogram
関数は、指定した列のすべての状態を一覧表示するテーブルを返します。詳細については、「 一般的な予測関数 (DMX)」を参照してください。
カスタム統計: 特定の分析タスクに関連する統計を生成するために、モデルの種類ごとに追加のサポート関数が提供されます。
たとえば、クラスタリング モデルを使用している場合は、関数
PredictCaseLikelihood
を使用して、特定のケースとクラスターに関連付けられた尤度スコアを返すことができます。 ただし、線形回帰モデルを作成した場合は、係数と切片の取得に関心があります。これはコンテンツ クエリを使用して行うことができます。モデル コンテンツ関数: すべてのモデルの 内容 は、単純なクエリで情報を取得できる標準化された形式で表されます。 DMX を使用して、モデル コンテンツに対するクエリを作成します。 データ マイニング スキーマ行セットを使用して、何らかの種類のモデル コンテンツを取得することもできます。
モデル コンテンツでは、返されるテーブルの各行またはノードの意味は、モデルの構築に使用されたアルゴリズムの種類と列のデータ型によって異なります。 詳細については、「 コンテンツ クエリ (データ マイニング)」を参照してください。
要求事項
モデルに対してクエリを作成する前に、データ マイニング モデルが処理されている必要があります。 Analysis Services オブジェクトの処理には、特別なアクセス許可が必要です。 マイニング モデルの処理の詳細については、「 処理要件と考慮事項 (データ マイニング)」を参照してください。
データ マイニング モデルに対してクエリを実行するには、実行するクエリの種類に応じて、さまざまなレベルのアクセス許可が必要です。 たとえば、ケースまたは構造データへのドリルスルーには、通常、マイニング構造オブジェクトまたはマイニング モデル オブジェクトに設定できる追加のアクセス許可が必要です。
ただし、クエリで外部データを使用し、OPENROWSET や OPENQUERY などのステートメントが含まれている場合は、クエリを実行するデータベースでこれらのステートメントを有効にする必要があり、基になるデータベース オブジェクトに対するアクセス許可が必要です。
データ マイニング クエリを実行するために必要なセキュリティ コンテキストの詳細については、「セキュリティの概要 (データ マイニング)」を参照してください。
このセクションにて
このセクションのトピックでは、各種類のデータ マイニング クエリについて詳しく説明し、データ mingin モデルに対してクエリを作成する方法の詳細な例へのリンクを示します。
関連タスク
これらのリンクを使用して、データ マイニング クエリを作成して操作する方法について説明します。
タスク | リンクス |
---|---|
データ マイニング クエリに関するチュートリアルおよびウォークスルーを表示する方法を確認する |
レッスン 6: 予測の作成と操作 (基本的なデータ マイニング チュートリアル) 時系列予測 DMX チュートリアル |
SQL Server Management Studio と SQL Server Data Tools (SSDT) でデータ マイニング クエリ ツールを使用する |
SQL Server Management Studio で DMX クエリを作成する 予測クエリ ビルダーを使用して予測クエリを作成する モデルに予測関数を適用する 予測クエリを手動で編集する |
予測クエリで使用される外部データを操作する |
予測クエリの入力データの選択とマップ 予測クエリの入力データの選択とマップ |
クエリの結果を操作する | 予測クエリの結果を表示および保存する |
Management Studio で提供されている DMX および XMLA クエリ テンプレートを使用する |
テンプレートからシングルトン予測クエリを作成する XMLA を使用してデータ マイニング クエリを作成する SQL Server Management Studio で Analysis Services テンプレートを使用する |
コンテンツ クエリの詳細と例を参照する |
マイニング モデルでコンテンツ クエリを作成する マイニング モデルの作成に使用するパラメーターのクエリを実行する コンテンツ クエリ (データ マイニング) |
クエリ オプションを設定し、クエリのアクセス許可と問題のトラブルシューティングを行う | データ マイニング クエリのタイムアウト値を変更する |
Integration Services でデータ マイニング コンポーネントを使用する |
データ マイニング クエリ タスク データ マイニング クエリ変換 |
こちらもご覧ください
データ マイニング アルゴリズム (Analysis Services - データ マイニング)
マイニング モデル コンテンツ (Analysis Services - データ マイニング)