次の方法で共有


Microsoft Purview で Amazon Redshift に接続する

スキャン機能

メタデータ抽出 フル スキャン 増分スキャン スコープスキャン
はい いいえ はい

重要

この機能は現在プレビューの段階です。 Microsoft Azure プレビューの補足使用条件には、ベータ版、プレビュー版、または一般公開されていない Azure 機能に適用される追加の法的条件が含まれています。

このドキュメントでは、Microsoft Purview で Amazon Redshift をスキャンするためのプレビューについて説明します。

サポートされている機能

その他の機能

分類秘密度ラベルポリシーデータ系列ライブ ビューについては、サポートされている機能の一覧を参照してください。

Amazon Redshift をスキャンする場合、Microsoft Purview では次のような技術的なメタデータの抽出がサポートされます。

  • サーバー
  • Databases
  • Schemas
  • 列、外部キー、一意の制約を含むテーブル
  • 列を含むビュー
  • パラメーター データセットを含むストアド プロシージャ
  • パラメーター データセットを含む関数

スキャンを設定するときに、Amazon Redshift データベース全体をスキャンするか、指定された名前または名前パターンに一致するスキーマのサブセットにスキャンのスコープを設定するかを選択できます。

既知の制限

  • オブジェクトがデータ ソースから削除された場合、現在、後続のスキャンでは、Microsoft Purview の対応する資産は自動的に削除されません。

前提条件

登録

このセクションでは、Purview でスキャンとデータ共有のために Amazon Redshift データ ソースを登録できます。

レジスタの前提条件

  • ソースを登録し、Microsoft Purview ガバナンス ポータルで管理するには、データ ソース 管理と他の Purview ロール (データ閲覧者、Data Share共同作成者など) のいずれかである必要があります。 詳細については、 Microsoft Purview のアクセス許可に関するページ を参照してください。

登録手順

データ ソースのスキャンを設定する前に、Microsoft Purview でデータ ソースを登録することが重要です。

  1. Microsoft Purview ガバナンス ポータルに移動するには、次の手順を実行します。

  2. データ マップ --> ソースに移動します

    Microsoft Purview ガバナンス ポータルを開くリンクを示すスクリーンショット

    データ マップの [ソース] リンクに移動するスクリーンショット

  3. [ ソース ] メニューの適切なコレクションに移動し、[ 登録 ] アイコンを選択して新しい Amazon Redshift データ ソースを登録します。

  4. Amazon Redshift データ ソースを選択し、[続行] を選択します。

  5. データ ソースに適した 名前 を指定し、次の詳細を指定します。

    1. エンドポイント - Amazon Redshift クラスターのエンドポイント。 例: examplecluster.abc123xyz789.us-west-2.redshift.amazonaws.com
    2. ポート - クラスターを起動したときに指定したポート番号。 既定値は 5439 です。

    Amazon Redshift の登録メニューを示すスクリーンショット。

  6. 選択したコレクションの下に Amazon Redshift クラスターが表示されます

スキャン

ヒント

スキャンに関する問題のトラブルシューティングを行うには:

  1. スキャン用の認証が適切に設定されていることを確認します。
  2. スキャンのトラブルシューティングに関するドキュメントを確認してください

スキャンの認証

Microsoft Purview では、Amazon Redshift をスキャンするための基本認証 (ユーザー名とパスワード) がサポートされています。

ユーザーには、Microsoft Purview がメタデータのクエリを実行するために、個々のシステム テーブルごとに SELECT アクセス許可が付与されている必要があります。

  • svv_external_tables
  • svv_external_columns
  • svv_table_info
  • information_schema.routines
  • information_schema.parameters
  • pg_views
  • pg_database
  • pg_description

また、ユーザーには、Microsoft Purview がメタデータのクエリを実行するためのシステム関数に対する EXECUTE アクセス許可が付与されている必要があります。

  • pg_get_late_binding_view_cols

資格情報を作成する

Microsoft Purview では、Azure Key Vaultを使用して、ソースでの認証に使用する資格情報を安全に格納します。

スキャンを作成する

  1. Microsoft Purview アカウントを開き、[Microsoft Purview ガバナンス ポータルを開く] を選択します

  2. [データ マップ] -->[ソース] に移動してコレクション階層を表示します

  3. 前に登録した Amazon Redshift データ ソースの下にある [新しいスキャン] アイコンを選択します。

  4. 統合ランタイムを選択します。

  5. 次の詳細を入力します。

    1. 名前 - スキャンの名前
    2. 資格情報 - 前に作成した資格情報を選択します
    3. データベース - スキャンするデータベース インスタンスの名前
    4. スキーマ - インポートするスキーマのサブセットを、セミコロンで区切られたスキーマの一覧として表します。 例: "schema1;schema2" そのリストが空の場合、すべてのユーザー スキーマがインポートされます。 既定では、すべてのシステム スキーマとオブジェクトは無視されます。 許容されるスキーマ名パターンは、静的名またはワイルドカード % を含めることができます。 例: "A%;%B;%C%;D":
      • A または から始める
      • B または で終わる
      • C または を含む
      • 等しい D

    Amazon Redshift のスキャン メニューを示すスクリーンショット。

  6. [ 接続のテスト] を選択して、設定を検証します。

  7. [続行] を選択します。

  8. [ スキャン トリガー] で 、スケジュールを設定するか、スキャンを 1 回実行するかを選択します。

  9. スキャンを確認し、[ 保存して実行] を選択します。

スキャンとスキャンの実行を表示する

既存のスキャンを表示するには:

  1. Microsoft Purview ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。
  2. データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。
  3. 表示する結果を含むスキャンを選択します。 このウィンドウには、以前のすべてのスキャン実行と、各スキャン実行の状態とメトリックが表示されます。
  4. 実行 ID を選択して、スキャン実行の詳細をチェックします

スキャンを管理する

スキャンを編集、取り消し、または削除するには:

  1. Microsoft Purview ポータルに移動します。 左側のウィンドウで、[ データ マップ] を選択します。

  2. データ ソースを選択します。 [最近のスキャン] で、そのデータ ソースの既存の スキャンの一覧を表示したり、[ スキャン ] タブですべてのスキャンを表示したりできます。

  3. 管理するスキャンを選択します。 次のことを実行できます。

    • [スキャンの編集] を選択して スキャンを編集します
    • [スキャンの実行の取り消し] を選択して、進行中 のスキャンを取り消します
    • [スキャンの削除] を選択して スキャンを削除します

注:

  • スキャンを削除しても、以前のスキャンから作成されたカタログ資産は削除されません。

資産の参照、検索、表示

Amazon Redshift クラスターを正常にスキャンしたら、統合カタログを参照するか、統合カタログを検索して資産の詳細を表示できます。

次の手順

Microsoft Purview とデータの詳細については、以下のガイドに従ってください。