データ ソースがMicrosoft Purview データ マップに登録されたら、次の手順ではデータ ソースをスキャンします。 スキャン プロセスでは、データ ソースへの接続を確立し、技術的なメタデータをキャプチャし、 サポートされているシステム分類 または カスタム分類のルールを使用してデータを自動的に分類できます。
たとえば、multiple.docxという名前 の ファイルがあり、そのコンテンツに国民 ID 番号がある場合、スキャン プロセス中にデータ マップは分類 EU 国民識別番号 をファイル資産の詳細ページに追加します。
これらの 分類は、 データ資産全体でデータの種類を特定するのに役立ちます。 たとえば、ファイルまたはテーブルにクレジット カード番号またはアドレスが含まれている場合。 その後、顧客 ID などの特定の種類の情報をより簡単に検索したり、機密データ型のセキュリティに優先順位を付けたりできます。
スキャン中に、ファイル資産と列資産に分類を自動的に適用できます。
この記事では、次について説明します。
分類を自動的に適用する
注:
分類は列に割り当てられるため、テーブル資産には自動的に割り当てられないが、 テーブル資産に分類を手動で適用することはできます。
データ ソースが 登録されたら、 スキャンを実行して、そのソースのデータ資産内のデータを自動的に分類できます。
データ ソースのソース記事の [スキャン] セクションを確認して、前提条件または認証が設定され、スキャンの準備ができているかどうかを確認します。
分類するデータ資産 (ファイルと列) を含む登録済みソースMicrosoft Purview データ マップを検索します。
リソースの下にある [新しいスキャン ] アイコンを選択します。
ヒント
[新しいスキャン] ボタンが表示されない場合は、正しいアクセス許可がない可能性があります。 スキャンを実行するには、ソースが登録されているコレクションに対する少なくとも データ ソース管理者のアクセス許可 が必要です。
資格情報を選択し、ソースで認証します。 (ソースでの認証の詳細については、特定のソース ソースに関する記事の前提条件とスキャンのセクションを参照してください)。[続行] を選択します。
必要に応じて、スキャンするソース内の資産を選択します。 ソースに応じて、すべての資産、またはフォルダー、ファイル、またはテーブルのサブセットをスキャンできます。
スキャン ルール セットを選択します。 使用可能なスキャン ルール セットの一覧が表示され、1 つを選択することも、上部の [新しいスキャン ルール セット] ボタンを使用して 新しいスキャン ルール セット を作成することもできます。 スキャン ルール セットは、比較してデータに適用する分類を決定します。 詳細については、 Microsoft Purview が資産を分類する方法に関するページを参照してください。
ヒント
スキャン ルール セットの作成時に使用できるオプションの詳細については、次の手順の手順 4 から開始 してスキャン ルール セットを作成します。
スキャンのスケジュールを設定します。
スキャンを保存して実行します。 スキャン ルール セット内の適用可能な分類は、スキャンする資産に自動的に適用されます。 スキャンが完了すると、それらを表示および管理できます。
分類の詳細を表示する
Microsoft Purview では、だれが分類を適用したか、いつ適用されたかなどの重要な詳細がキャプチャされます。 詳細を表示するには、分類にカーソルを合わせて [分類の詳細] カードを確認します。 分類の詳細カードには、次の情報が表示されます。
- 分類名 - 資産または列に適用される分類の名前。
- 適用元 - 分類を適用したユーザー。 使用可能な値は、スキャンとユーザー名です。
- 適用時間 - スキャンまたは手動で分類が適用されたときのローカル タイムスタンプ。
- 分類の種類 - システムまたはカスタム。
データ キュレーター ロールを持つユーザーは、スキャンによって自動的に適用された分類の詳細を確認できます。 これらの詳細には、スキャナーがデータを分類するために読み取ったサンプル数と、スキャナーが見つけたサンプル内の個別のデータ数が含まれます。
既存の分類に対する再スキャンの影響
分類タグは、データをサンプリングし、それらのサンプルを定義済みの RegEx パターンまたはディクショナリと照合した結果に基づいて、初めて自動的に適用されます。 後続の再スキャンでは、いくつかの要因に応じて分類タグを保持、削除、または段階的に追加できます。
スキャン実行では、手動で適用された分類タグは削除されません。
スキャン実行では、手動で削除された分類タグは再適用されません。
同じスキャン ルールを引き続き使用するスキャンの後で実行すると、分類タグを更新できます。
スキャン実行の場合、前のスキャンの分類タグは、次の表に示す条件に基づいて削除または保持されます。
ファイルの種類 ファイルのサイズ 以前のスキャンの分類タグは次のようになります。 サイズのないファイルの種類 (SQL など) すべて 保持 .doc、.docm、.docx、.dot、.odp、.ods、.odt、.pdf、.pot、.pps、.ppsx、.ppt、.pptm、.pptx、.txt、.xlc、.xls、.xlsb、.xlsm、.xlsx、.xlt >20 MB 保持 .doc、.docm、.docx、.dot、.odp、.ods、.odt、.pdf、.pot、.pps、.ppsx、.ppt、.pptm、.pptx、.txt、.xlc、.xls、.xlsb、.xlsm、.xlsx、.xlt <20 MB 削除 GZ >400 KB 保持 GZ <400 KB 削除 拡張子または構造化ファイルの種類がないファイル > 1 MB 保持 拡張子または構造化ファイルの種類がないファイル < 1 MB 削除
Microsoft Purview で資産を分類する方法
データ ソースがスキャンされると、Microsoft Purview は資産内のデータを 、スキャン ルール セットと呼ばれる分類の一覧と比較します。
各データ ソースに対して既に使用可能な システム スキャン ルール セット があり、そのデータ ソースに対して現在使用可能なすべてのシステム分類が含まれています。 または、 カスタム スキャン ルール セットを作成 して、データ セットに合わせて分類の一覧を作成することもできます。
データを分類の種類を少なく比較するとスキャン プロセスが高速化されるため、データが特定の種類の情報や地域に限定されている場合は、データのカスタム ルール セットを作成することをお勧めします。 たとえば、データセットにヨーロッパのデータのみが含まれている場合は、他のリージョンの識別を除外するカスタム スキャン ルール セットを作成できます。
カスタム分類と分類ルールを作成した場合は、 カスタム分類 をスキャン中に自動的に適用できるように、カスタム ルールセットを作成することもできます。
使用可能なシステム分類とデータの分類方法の詳細については、 システム分類の一覧を参照してください。
次の手順
- カスタム分類を作成する方法について説明します。
- 分類を手動で適用する方法について説明します。