次の方法で共有


データ マップでデータ ソースをスキャンする

Microsoft Purview では、 データ ソースを登録した後、ソースをスキャンして技術的なメタデータをキャプチャし、スキーマを抽出し、データに分類を適用できます。

この記事では、データ ソースをスキャンするための基本的な手順について説明します。

ヒント

各ソースには、独自の手順とスキャンの前提条件があります。 最も完全なスキャン手順については、 サポートされているソースの一覧からソース を選択し、そのスキャン手順を確認します。

前提条件

Microsoft Purview で登録およびスキャンできるソースの一覧を確認します。

データ ソースをスキャンする前に、次の手順を実行する必要があります。

  1. 基本的に Microsoft Purview にデータ ソースのアドレスを提供するデータ ソースを登録し、Microsoft Purview データ マップのコレクションまたはドメインにマップします。
  2. ネットワークを検討し、 シナリオに適した統合ランタイム構成を選択します
  3. ソースへの接続に使用する資格情報を検討します。 すべての ソース ページ には、使用可能な認証の種類に関する詳細を含む [スキャン ] セクションがあります。

スキャンを作成する

次の手順では、例として Azure Blob Storage を使用し、Microsoft Purview マネージド ID を使用して認証します。

重要

これらはスキャンを作成するための一般的な手順ですが、 ソース固有の 前提条件とスキャン手順についてはソース ページを参照する必要があります。

  1. Microsoft Purview ポータルを開き、[データ マップ] -> [データ ソース] に移動して、登録されているソースをマップ ビューまたはテーブル ビューで表示します。

    ヒント

    Data Map に多数の登録済みソースがある場合、テーブル ビューのパフォーマンスが高くなることがあります。

  2. ソースを見つけて、[ 新しいスキャン] を選択します。

  3. スキャンの 名前 を入力します。

  4. [ 資格情報] で、認証方法を選択します。

  5. スキャンの現在のドメイン、コレクション、またはサブ コレクションを選択します。 選択したコレクションまたはドメインには、スキャン中に検出されたメタデータが格納されます。

    注:

    スキャンは常に登録済みソースと同じドメインに存在しますが、サブコレクションを選択できます。

  6. [ 接続のテスト] を選択します。 接続に成功した場合は、[ 続行] を選択します。 接続が成功しない場合の トラブルシューティング に関するページを参照してください。

  7. ソースに応じて、スキャンの範囲を特定のデータのサブセットにすることができます。 Azure Blob Storageの場合は、一覧で適切な項目を選択して、フォルダーとサブフォルダーを選択します。

    ファイルとフォルダーが選択されたスキャン ウィンドウのスコープを示すスクリーンショット。

  8. スキャン ルール セットを選択します。 スキャン ルール セットには、スキャン チェックの 種類のデータ分類が 含まれています。 システムの既定値 (ソースで使用できるすべての分類を含む) を選択するか、organization内の他のユーザーによって行われた既存のカスタム ルール セットを選択するか、新しいルール セットをインラインで作成できます。

    注:

    選択できるのは、ソースが登録されているドメインに関連付けられている資格情報とスキャン ルール セットのみです。

  9. スキャン トリガーを選択します。 スケジュールを設定することも、スキャンを 1 回実行することもできます。 サポートされている スケジュール オプションの詳細については、こちらをご覧ください。

  10. スキャンを確認し、[ 保存して実行] を選択します。

スキャンをスケジュールする

スキャンを設定するときは、1 回/オンデマンドで実行するか、定期的なスケジュールで実行するかを選択できます。 次のスケジュール オプションを構成できます。

  • タイム ゾーン: スキャン スケジュールを調整するタイム ゾーンを選択します。 選択したタイム ゾーンで夏時間が表示される場合、トリガーは差分の自動調整を行います。
  • 繰り返し: 毎日毎週、または 毎月 のスキャンの繰り返しを選択できます。
    • 毎日の繰り返し: 繰り返しを X 日ごとに設定し、その日のスキャン開始時刻を指定します。
    • 週単位の繰り返し: 繰り返しを X 週ごとに設定し、1 つまたは複数の曜日を選択し、その日のスキャン開始時刻を指定します。
    • 毎月の繰り返し: 繰り返しを X か月ごとに設定し、月の日または平日を選択し、月の 1 つまたは複数の日/平日を選択し、その日のスキャン開始時刻を指定します。
  • [開始の繰り返し] : スキャン スケジュールが開始されるタイミングを設定します。
  • 繰り返しの終了日を指定する (省略可能): 一定の時間が経過した後にスキャンを停止する場合は、[チェック] ボックスを選択して終了日を指定して、このオプションを有効にすることができます。

スキャン トリガーの設定ページのスクリーンショット。

スキャンを表示する

データ ソース内のデータ量によっては、スキャンの実行に時間がかかる場合があるため、進行状況をチェックし、スキャンが完了したときに結果を確認する方法を次に示します。

  1. スキャンは、コレクション、ドメイン、またはソース自体から表示できます。

  2. コレクションまたはドメインから表示するには、データ マップの [コレクション ] または [ドメイン] に移動し、[スキャン] を選択 します

    [スキャン] ボタンが強調表示されているコレクション ページのスクリーンショット。

  3. スキャン名を選択して詳細を表示します。

    最新のスキャン名が強調表示されているコレクション リスト内のスキャンのスクリーンショット。

  4. または、コレクションまたはドメイン内のデータ ソースに直接移動し、[詳細の表示] を選択してスキャンの状態をチェックすることもできます。

    ソースの [ビューの詳細] ボタンが強調表示されている Data Map のスクリーンショット。

  5. スキャンの詳細は、前回の実行状態でのスキャンの進行状況と、スキャンおよび分類された資産の数を示します。

    アセットとスキャンが強調表示されているソース詳細ページのスクリーンショット。

  6. スキャン全体が正常に実行されると、[ 最終実行] 状態[進行中 ] に更新され、[ 完了] に更新されます

    進行中の状態を示すスキャンを含むソースの詳細ページのスクリーンショット。

    完了した状態を示すスキャンを含むソースの詳細ページのスクリーンショット。

スキャンを管理する

スキャンが完了すると、そのスキャンを管理または再実行できます。

  1. コレクションの一覧またはソース ページから [ スキャン名 ] を選択して、スキャンを管理します。

    [スキャン名] リンクが強調表示されているソースの詳細ページのスクリーンショット。

  2. スキャンをもう一度実行し、スキャンを編集しスキャンを削除できます

    実行、編集、削除のボタンが強調表示された [スキャンの管理] ページのスクリーンショット。

  3. フル スキャンを実行すると、スコープ内のすべてのコンテンツがスキャンされますが、一部のソースでは 増分スキャン も使用できます。 増分スキャンでは、前回のスキャン以降に更新されたリソースのみがスキャンされます。 ソース ページで サポートされている機能 テーブルを確認して、最初のスキャン後にソースで増分スキャンを使用できるかどうかを確認します。

    [今すぐスキャンを実行] ボタンのスクリーンショット。完全なスキャン オプションと増分スキャン オプションが表示されています。

トラブルシューティング

スキャンの接続の設定は、ネットワークと資格情報のカスタム 設定であるため、複雑になる可能性があります。

ソースに接続できない場合は、次の手順に従います。

  1. ソース ページの前提条件を確認して、見逃したことがないことを確認します。
  2. ソース ページの [スキャン ] セクションで認証オプションを確認して、認証方法が正しく設定されていることを確認します。
  3. 接続のトラブルシューティングを確認します
  4. サポート リクエストを作成して、サポート チームが特定の環境のトラブルシューティングを支援できるようにします。

次の手順