次の方法で共有


Azure Data Lake Gen 2 を使用するようにデータフロー ストレージを構成する

Power BI で使用されるデータは、既定で Power BI によって提供される内部ストレージに格納されます。 データフローと Azure Data Lake Storage Gen 2 (ADLS Gen2) の統合により、組織の Azure Data Lake Storage Gen2 アカウントにデータフローを格納できます。 この機能を使用すると、基本的に Power BI データフローに "独自のストレージを持ち込む" ことができます。また、テナントまたはワークスペース レベルで接続を確立できます。

ADLS Gen 2 ワークスペースまたはテナント接続を使用する理由

データフローをアタッチすると、Power BI によって参照が構成されて保存され、独自の ADLS Gen 2 に対するデータの読み取りと書き込みができるようになりました。 Power BI は、データを共通データ モデル (CDM) 形式で格納します。この形式では、データフロー自体によって生成された実際のデータに加えて、データに関するメタデータがキャプチャされます。 この機能により、多くの強力な機能のロックが解除され、データと関連するメタデータが CDM 形式で機能拡張、自動化、監視、バックアップのシナリオに対応できるようになります。 このデータを自分の環境で利用でき、広くアクセスできるようにすると、組織内で作成された分析情報とデータを民主化できます。 また、さまざまな複雑さのソリューションを作成する機能のロックを解除します。 ソリューションは、Power Platform、Azure、およびパートナーおよび独立系ソフトウェア ベンダー (ISV) エコシステムを通じて利用できる CDM 対応のカスタム アプリケーションとソリューションにすることができます。 または、CSV を読み取るアプリケーションを作成することもできます。 データ エンジニア、データ サイエンティスト、アナリストは、ADLS Gen 2 でキュレーションされた一般的なデータ セットを操作、使用、再利用できるようになりました。

使用する ADLS Gen 2 ストアを構成するには、2 つの方法があります。テナント割り当て ADLS Gen 2 アカウントを使用するか、ワークスペース レベルで独自の ADLS Gen 2 ストアを持ち込むことができます。

[前提条件]

  • 独自の ADLS Gen 2 アカウントを使用するには、ストレージ アカウント レイヤーで 所有者 アクセス許可が必要です。 リソース グループまたはサブスクリプション レベルのアクセス許可は機能しません。 管理者の場合でも、所有者アクセス許可を自分自身に割り当てる必要があります。 現在、ファイアウォールの背後にある ADLS Gen2 ストレージ アカウントはサポートされていません

  • ストレージ アカウントは、 階層型名前空間 (HNS) を有効にして作成する必要があります。

  • ストレージ アカウントは、 Power BI テナントと同じ Microsoft Entra テナントに作成する必要があります。

  • ユーザーは、ストレージ BLOB データ所有者ロール、ストレージ BLOB データ閲覧者ロール、およびストレージ アカウント レベルの所有者ロールを持っている必要があります (スコープ はこのリソース であり、継承されません)。 適用されたロールの変更は同期に数分かかる場合があり、Power BI サービスで次の手順を完了する前に同期する必要があります。

  • Pro ワークスペースの場合、ストレージ アカウントは Fabric ホーム リージョンと同じリージョンに存在する必要があります。 Premium ワークスペースの場合、ストレージ アカウントは Premium 容量と同じリージョンに存在する必要があります。

  • エンドポイントをセキュリティで保護するには、TLS (トランスポート層セキュリティ) バージョン 1.2 以降が必要です。 TLS 1.2 より前のバージョンの TLS を使用する Web ブラウザーやその他のクライアント アプリケーションは接続できません。

  • 多要素認証 (MFA) の背後にある ADLS Gen 2 を使用したデータフローのアタッチはサポートされていません。

  • 最後に、 管理ポータルから任意の ADLS Gen 2 に接続できますが、ワークスペースに直接接続する場合は、接続する前に、まずワークスペースにデータフローがないことを確認する必要があります。

米国政府 GCC のお客様向けの Power BI サービスでは、ストレージを持ち込む機能 (Azure Data Lake Gen 2) を利用できません。 使用可能な機能と使用できない機能の詳細については、 米国政府のお客様向けの Power BI 機能の可用性に関する記事を参照してください。

次の表では、ADLS Gen 2 と Power BI に必要な ADLS と Power BI のアクセス許可について説明します。

アクション ADLS のアクセス許可 Power BI の最小アクセス許可
ADLS Gen 2 を Power BI テナントに接続する オーナー Power BI 管理者
ADLS Gen 2 をワークスペースに接続する オーナー ワークスペース管理者
接続された ADLS アカウントに書き戻す Power BI データフローを作成する 適用なし ワークスペースの貢献者
Power BI データフローを使用する 適用なし ワークスペース ビューアー

ワークスペース レベルで Azure Data Lake Gen 2 に接続する

データフローがないワークスペースに移動します。 ワークスペース設定を選択します。 [ Azure 接続 ] タブを選択し、[ ストレージ ] セクションを選択します。

[Azure 接続] タブの [ワークスペース設定] ウィンドウのスクリーンショット。

管理者がテナント割り当て ADLS Gen 2 アカウントを既に構成している場合は、[ 既定の Azure 接続を使用する ] オプションが表示されます。 次の 2 つのオプションがあります。

  • [ 既定の Azure 接続を使用する] というボックスを選択して、テナントで構成された ADLS Gen 2 アカウントを使用します。
  • [ Azure に接続] を選択して、新しい Azure Storage アカウントをポイントします。

[ Azure への接続] を選択すると、Power BI はアクセス権を持つ Azure サブスクリプションの一覧を取得します。 ドロップダウンを入力します。 次に、階層型名前空間オプションが有効になっている有効な Azure サブスクリプション、リソース グループ、ストレージ アカウント (ADLS Gen2 フラグ) を選択します。 Azure への接続に使用される個人アカウントは、最初の接続を設定し、データの読み取りと書き込みの権限を Power BI サービス アカウントに付与するために 1 回だけ使用されます。その後、接続をアクティブに保つために元のユーザー アカウントは不要になります。

[Azure への接続] を選択した後の [設定] ウィンドウのスクリーンショット。

選択した後、[ 保存] を選択すると、ワークスペースが独自の ADLS Gen2 アカウントに正常に接続されました。 Power BI は、必要なアクセス許可でストレージ アカウントを自動的に構成し、データが書き込まれる Power BI ファイルシステムを設定します。 この時点で、このワークスペース内のすべてのデータフローのデータは、他の Azure サービスで使用できるこのファイル システムに直接書き込まれます。 これで、すべての組織または部門のデータの単一のソースが作成されました。

Azure 接続の構成

Azure 接続の構成は、オプションで設定できるその他のプロパティを含むオプションの設定です。

  • 既定値を設定できるテナント レベルのストレージと、
  • ワークスペース レベルのストレージ。ワークスペースごとに接続を指定できます

一元化されたデータ レイクのみを使用する場合、またはこのストレージを既定のオプションにする場合は、必要に応じてテナント レベルのストレージを構成できます。 既定を使用して構成の柔軟性を確保することは自動的に開始されないため、必要に応じてこの接続を使用するワークスペースを柔軟に構成できます。 テナント割り当て ADLS Gen 2 アカウントを構成する場合でも、この既定のオプションを使用するように各ワークスペースを構成する必要があります。

必要に応じて、またはワークスペース レベルのストレージアクセス許可を個別のオプションとして構成できます。ワークスペースごとに特定の ADLS Gen 2 アカウントを柔軟に設定できます。

要約すると、テナント レベルのストレージとワークスペース レベルのストレージのアクセス許可が許可されている場合、ワークスペース管理者は必要に応じて既定の ADLS 接続を使用するか、既定とは別のストレージ アカウントを構成することを選択できます。 テナント ストレージが設定されていない場合、ワークスペース管理者は必要に応じてワークスペースごとに ADLS アカウントを構成できます。 最後に、テナント レベルのストレージが選択されていて、ワークスペース レベルのストレージが許可されていない場合、ワークスペース管理者は必要に応じて、この接続を使用するようにデータフローを構成できます。

ADLS Gen 2 ワークスペース接続の構造と形式

ADLS Gen 2 ストレージ アカウントでは、すべてのデータフローがファイルシステムの powerbi コンテナーに格納されます。

powerbi コンテナーの構造は、<workspace name>/<dataflow name>/model.json<workspace name>/<dataflow name>/model.json.snapshots/<all snapshots>、および<workspace name>/<dataflow name>/<table name>/<tablesnapshots>

データフローが ADLS Gen 2 のフォルダー階層にデータを格納する場所は、ワークスペースが共有容量か Premium 容量かに関係なく同じです。

次の例では、Northwind Odata サンプルの Orders テーブルを使用します。

Northwind Odata サンプルの Orders テーブルを使用した例を示すエクスプローラーのスクリーンショット。

前の画像において

  • model.json は、データフローの最新バージョンです。
  • model.json.snapshots は、データフローの過去のすべてのバージョンです。 この履歴は、以前のバージョンのマッシュアップまたは増分設定が必要な場合に便利です。
  • tablename は、データフローの更新が完了した後の結果のデータを含むフォルダーです。

このストレージ アカウントに書き込むだけで、現在データは削除されません。 そのため、デタッチ後も ADLS アカウントから削除されないため、上記の一覧に記載されているすべてのファイルは引き続き保存されます。

データフローを使用すると、他のデータフロー内のテーブルをリンクまたは参照できます。 このようなデータフローでは、 model.json ファイルは、同じワークスペースまたは他のワークスペース内の別のデータフローの別の model.json を参照できます。

ADLS Gen 2 ストレージ アカウント間または ADLS Gen 2 ストレージ アカウント内でのファイルの移動

データフローをある ADLS Gen2 ストレージ アカウントから別の ADLS Gen2 ストレージ アカウントに移動する場合は、 model.json ファイル内のパスが新しい場所を反映するように更新されていることを確認する必要があります。 これは、 model.json ファイルにデータフローへのパスとデータへのパスが含まれているためです。 パスを更新しないと、データフローはデータを見つけられないので、アクセス許可エラーが発生します。 パスを更新するには、次の手順に従います。

  • テキスト エディターで model.json ファイルを開きます。
  • ストレージ アカウントの URL を見つけて、新しいストレージ アカウントの URL に置き換えます。
  • ファイルを保存します。
  • ADLS Gen2 ストレージ アカウント内の既存の model.json ファイルを上書きします。

ADLS Gen 2 ワークスペース接続の拡張性

ADLS Gen 2 を Power BI に接続している場合は、ワークスペースまたはテナント レベルでこのアクションを実行できます。 適切なアクセス レベルがあることを確認します。 詳細については、前提条件を参照してください。

ストレージ構造は、Common Data Model 形式に準拠しています。 ストレージ構造と CDM の詳細については、「 分析データフローのストレージ構造とは」 を参照し、「 Common Data Model を使用して Azure Data Lake Storage Gen2 を最適化する」を参照してください。

適切に構成されると、データとメタデータをあなたが管理することができます。 多くのアプリケーションは CDM を認識しており、Azure、PowerApps、Power Automate を使用してデータを拡張できます。 また、形式に準拠するか、生データを読み取ることによって、サードパーティのエコシステムを使用することもできます。

ワークスペースまたはテナントから Azure Data Lake Gen 2 をデタッチする

ワークスペース レベルで接続を削除するには、まず、ワークスペース内のすべてのデータフローが削除されていることを確認する必要があります。 すべてのデータフローが削除されたら、ワークスペース設定で [切断 ] を選択します。 テナントにも同じことが当てはまりますが、テナント レベルで切断できるようにするには、まず、すべてのワークスペースもテナント ストレージ アカウントから切断されていることを確認する必要があります。

Azure Data Lake Gen 2 を無効にする

管理ポータルデータフローでは、ユーザーがこの機能を使用するためのアクセスを無効にすることができ、ワークスペース管理者が自分の Azure Storage を持ち込むのを禁止できます。

Azure Data Lake Gen 2 から元に戻す

Azure Data Lake Gen 2 を使用するようにデータフロー ストレージを構成した後、自動的に元に戻す方法はありません。 Power BI マネージド ストレージに戻るプロセスは手動です。

Gen 2 に対して行った移行を元に戻すには、データフローを削除し、同じワークスペースで再作成する必要があります。 その後、ADLS Gen 2 からデータを削除しないため、リソース自体に移動してデータをクリーンアップします。 このアクションには、次の手順が含まれます。

  1. Power BI からデータフローのコピーをエクスポートします。 または、model.json ファイルをコピーします。 model.json ファイルは ADLS に格納されます。

  2. データフローを削除します。

  3. ADLS をデタッチします。

  4. インポートを使用してデータフローを再作成します。 増分更新データ (該当する場合) は、インポートする前に削除する必要があります。 このアクションは、model.json ファイル内の関連するパーティションを削除することで実行できます。

  5. インクリメンタルリフレッシュポリシーを設定して更新/再作成します。

ADLS Gen 2 コネクタを使用してデータに接続する

このドキュメントのスコープでは、Power BI ADLS Gen 2 コネクタではなく、ADLS Gen 2 データフロー接続について説明します。 ADLS Gen 2 コネクタの利用は、個別のシナリオであり、追加の可能性があります。 ADLS コネクタでは、単に ADLS をデータソースとして使用します。 そのため、Power Query Online を使用して、そのデータに対してクエリを実行する必要はありません。CDM 形式である必要はありません。お客様が望むデータ形式にすることができます。 詳細については、「 Azure Data Lake Storage Gen2」を参照してください。

データフローと Power BI の詳細については、以下の記事を参照してください。