この Azure Batch サービスのコア コンポーネントの概要では、Batch 開発者が大規模な並列コンピューティング ソリューションを構築するために使用できる高度なワークフローと、使用されるプライマリ サービス リソースについて説明します。
直接 REST API 呼び出しを発行する分散計算アプリケーションまたはサービスを開発する場合でも、 Batch SDK のいずれかを使用する場合でも、ここで説明する多くのリソースと機能を使用します。
ヒント
Batch サービスの概要については、「 Azure Batch とは」を参照してください。 また、最新の Batch サービスの更新も参照してください。
の基本的なワークフロー
次の大まかなワークフローは、Batch サービスを使用して並列ワークロードを処理するほぼすべてのアプリケーションとサービスの一般的なワークフローです。
- 処理する データ ファイル を Azure Storage アカウントにアップロードします。 Batch には Azure Blob Storage へのアクセスに対する組み込みのサポートが含まれており、タスクの実行時にこれらのファイルを コンピューティング ノード にダウンロードできます。
- タスクを実行する アプリケーション ファイル をアップロードします。 これらのファイルは、バイナリまたはスクリプトとその依存関係であり、ジョブ内のタスクによって実行されます。 タスクでは、これらのファイルをストレージ アカウントからダウンロードすることも、アプリケーションの管理とデプロイに Batch の アプリケーション パッケージ 機能を使用することもできます。
- コンピューティング ノードの プール を作成します。 プールを作成するときは、プールのコンピューティング ノードの数、サイズ、オペレーティング システムを指定します。 ジョブ内の各タスクが実行されると、プール内のいずれかのノードで実行するように割り当てられます。
- ジョブを作成します。 ジョブはタスクのコレクションを管理します。 各ジョブは、そのジョブのタスクが実行される特定のプールに関連付けます。
- ジョブにタスクを追加します。 各タスクは、アップロードしたアプリケーションまたはスクリプトを実行して、ストレージ アカウントからダウンロードしたデータ ファイルを処理します。 各タスクが完了すると、その出力を Azure Storage にアップロードできます。
- ジョブの進行状況を監視し、Azure Storage からタスクの出力を取得します。
注
Batch サービスを使用するには Batch アカウント が必要です。 ほとんどの Batch ソリューションでは、ファイルのストレージと取得に関連付けられている Azure Storage アカウントも使用されます。
バッチ サービス リソース
次のトピックでは、分散計算シナリオを可能にする Batch のリソースについて説明します。
次のステップ
- Batch ソリューションの構築に使用できる Batch API とツールについて学習します。
- Batch .NET クライアント ライブラリまたは Python を使用した Batch 対応アプリケーションの開発に関する基本事項を確認してください。 これらのクイック スタートでは、Batch サービスを使用して複数のコンピューティング ノードでワークロードを実行し、ワークロード ファイルのステージングと取得に Azure Storage を使用するサンプル アプリケーションについて説明します。
- Batch ソリューションの開発中に使用するために 、Batch Explorer をダウンロードしてインストールします。 Batch Explorer を使用して、Azure Batch アプリケーションの作成、デバッグ、監視に役立ちます。
- Stack Overflow、Batch コミュニティ リポジトリ、Azure Batch フォーラムなどのコミュニティ リソースを参照してください。