次の方法で共有


Azure でのデータ分析とレポート テクノロジの選択

ほとんどのビッグ データ ソリューションの目的は、分析とレポートによってデータに関する実用的な情報を提供することにあります。 分析とレポートには、事前構成済みのレポートと視覚化、または対話型のデータ探索を含めることができます。

データ分析テクノロジのオプション

Azure での分析、視覚化、レポートには、ニーズに応じていくつかのオプションがあります。

Power BI

Power BI はビジネス分析ツールのスイートです。 何百ものデータ ソースに接続でき、計画外の分析に使用できます。 Power BI Embedded を使用して、追加のライセンスを必要とせずに、独自のアプリケーション内に Power BI を統合します。

組織では、Power BI を使用してレポートを作成し、組織に公開できます。 すべてのユーザーは、ガバナンスとセキュリティが組み込まれたパーソナライズされたダッシュボードを作成できます。 Power BI では 、Microsoft Entra ID を 使用して、Power BI サービスにサインインするユーザーを認証します。 ユーザーが認証を必要とするリソースにアクセスしようとすると、Power BI 資格情報が使用されます。

Jupyter Notebook

Jupyter Notebook には 、データ サイエンティストが Python、Scala、または R コードと Markdown テキストを含む ノートブック ファイルを作成できるブラウザーベースのシェルが用意されています。 これらの機能により、ノートブックは、コードと結果を 1 つのドキュメントで共有および文書化することで効果的に共同作業を行うことができます。

Spark や Hadoop など、ほとんどの種類の HDInsight クラスターは、データを操作し、処理用のジョブを送信するために Jupyter Notebook で事前構成されています 。 使用する HDInsight クラスターの種類に応じて、コードを解釈して実行するための 1 つ以上のカーネルが提供されます。 たとえば、HDInsight 上の Spark クラスターには、Spark エンジンを使用して Python または Scala コードを実行するために選択できる Spark 関連のカーネルが用意されています。

Jupyter Notebook は、Power BI などの BI レポート ツールを使用して、より高度な視覚化を構築する前に、データを分析、視覚化、処理するための効果的な環境を提供します。

Zeppelin Notebook

Zeppelin ノートブックには、 Jupyter Notebook と同様の機能を備えるブラウザーベースのシェルも用意されています。 一部の HDInsight クラスターは 、Zeppelin ノートブックで事前構成されています。 ただし、 HDInsight 対話型クエリ (Apache Hive LLAP とも呼ばれます) クラスターを使用する場合、 Zeppelin は対話型 Hive クエリの実行に使用できる唯一のノートブックです。 また、 ドメイン参加済み HDInsight クラスターを使用する場合、Zeppelin Notebook は、ノートブックと基になる Hive テーブルへのアクセスを制御するために異なるユーザー ログインを割り当て可能な唯一の種類のノートブックです。

VS Code での Jupyter Notebook

VS Code は、無料のコード エディターと開発プラットフォームであり、ローカルでもリモート コンピューティングに接続しても使用できます。 Jupyter 拡張機能で VS Code を使用すると、Jupyter 開発用に完全に統合された環境が提供され、より多くの言語拡張機能で拡張できます。 クラス最高の無料 Jupyter エクスペリエンスを提供し、選択したコンピューティングを使用できるようにする場合は、このオプションを選択します。

VS Code を使用すると、リモートとコンテナーに対してノートブックを開発して実行できます。 Azure ノートブックからの移行を簡略化するために、コンテナー イメージを VS Code で使用することもできます。

Jupyter (旧称 IPython Notebook) は、ノートブックと呼ばれる 1 つのキャンバス上で Markdown テキストと実行可能な Python ソース コードを簡単に組み合わせることができるオープンソース プロジェクトです。 VS Code では、ネイティブおよび Python コード ファイルを使用した Jupyter ノートブックの操作がサポートされています。

主要な選択条件

次の質問に答えて、選択肢を絞り込み始めます。

  • 多数のデータ ソースに接続し、ドメイン全体に分散されたデータのレポートを作成するための一元的な場所を提供する必要がありますか? その場合は、数百のデータ ソースに接続できるオプションを選択します。

  • 動的視覚化を外部 Web サイトまたはアプリケーションに埋め込みますか? その場合は、埋め込み機能を提供するオプションを選択します。

  • オフラインでも視覚化やレポートを作成したいですか。 その場合は、オフライン機能を備えるオプションを選択します。

  • 大規模または複雑な AI モデルをトレーニングしたり、大規模なデータ セットを操作したりするには、大量の処理能力が必要ですか? その場合は、ビッグ データ クラスターに接続できるオプションを選択します。

能力マトリックス

次の表は、機能の主な違いをまとめたものです。

一般的な機能

能力 Power BI Jupyter Notebook Zeppelin Notebook VS Code での Jupyter Notebook
高度な処理のためにビッグ データ クラスターに接続する はい はい はい いいえ
管理されたサービス はい はい 1 はい 1 はい
何百ものデータ ソースに接続する はい いいえ いいえ いいえ
オフライン機能 はい 2 いいえ いいえ いいえ
埋め込み機能 はい いいえ いいえ いいえ
データの自動更新 はい いいえ いいえ いいえ
多数のオープンソース パッケージへのアクセス いいえ はい 3 はい 3 はい 4
データ変換またはクレンジング オプション Power Query、R Python、R、Julia、Scala などの 40 言語 Python、JDBC、R を含む 20 を超えるインタープリター Python、F#、R
価格 Power BI Desktop (オーサリング) では無料。 ホスティング オプションについては、「 Power BI の価格 」を参照してください。 無料 無料 無料
マルチユーザー コラボレーション はい はい (共有または JupyterHub のようなマルチユーザー サーバーを使用) はい はい (シェアを通じて)

[1] 管理される HDInsight クラスターの一部として使用する場合。

[2] Power BI Desktop を使用する場合。

[3] Maven リポジトリ でコミュニティが提供するパッケージを検索できます。

[4] pip または Conda を使用して Python パッケージをインストールできます。 CRAN または GitHub から R パッケージをインストールできます。 パケット依存関係マネージャーを使用して、nuget.org を使用して F# にパッケージをインストールできます。

貢献者

Microsoft では、この記事を保持しています。 次の共同作成者がこの記事を書きました。

プリンシパル作成者:

公開されていない LinkedIn プロフィールを見るには、LinkedIn にサインインしてください。

次のステップ