次の方法で共有


Microsoft HPC Pack を使用して Azure ノードをデプロイする手順

このトピックでは、HPC Pack を実行しているクラスターの "バースト" シナリオで Azure ノードをデプロイするための全体的なプロセスについて説明します。

Hpc Pack 2008 R2 Service Pack 1 以降では、Azure ノードの追加のサポートを利用できます。

[前提条件]

Windows HPC クラスターに Azure ノードをデプロイする前に、次のことを確認します。

  • クラスターとネットワーク環境が Azure ノードをデプロイするための要件を満たしている

  • Azure サブスクリプションにアクセスできます

  • Azure サブスクリプションは、必要な管理証明書、クラウド サービス、ストレージ アカウント、およびシナリオに必要なその他の Azure 機能を使用して構成されます

詳細については、次のトピックを参照してください。

多数の Azure ノードをデプロイする予定の場合は、ローカル クラスター環境と Azure サブスクリプションで追加の構成が必要になる場合があります。 詳細については、「 Microsoft HPC Pack を使用した Azure ノードの大規模デプロイのベスト プラクティス」を参照してください。

手順 1: Azure ノード テンプレートを作成する

Azure ノード テンプレートを作成するには、HPC クラスター マネージャーでノード テンプレートの作成ウィザードを使用します。

Azure ノード テンプレートには、次の構成情報が含まれています。

  • クラスターに一連の Azure ノードを追加するために使用される Azure サブスクリプションからの情報。 最小限の情報には、Azure サブスクリプション ID、Azure 管理証明書の証明書拇印、Azure クラウド サービスの名前、ストレージ アカウントの名前が含まれます。 詳細については、「 Microsoft HPC Pack の Azure サブスクリプション情報について」を参照してください。

  • 必要に応じて、HPC Pack のバージョンでサポートされている追加の Azure 機能を有効にする設定です。 これらの追加設定の構成の詳細については、「 Microsoft HPC Pack 用の Azure ノード テンプレートの構成」を参照してください。

    HPC Pack のバージョンでサポートされている場合は、Azure ノード テンプレートで構成する前に、Azure 仮想ネットワークなどの特定の Azure 機能を Azure サブスクリプションで事前構成する必要があります。

  • ノードの可用性ポリシー 。つまり、Azure ノードの起動方法とタイミング (Azure ロール インスタンスがプロビジョニングされます) と停止 (ロール インスタンスは Azure クラウド サービスから削除されます)。 詳細については、「 Azure Node 可用性ポリシーについて」を参照してください。

Azure ノード テンプレートを作成するには

  1. HPC クラスター マネージャーを起動します。

  2. [構成]ナビゲーション ウィンドウで、[ノード テンプレート] をクリックします。

  3. [操作] ウィンドウで、[新規作成] をクリックします。 ノード テンプレートの作成ウィザードが表示されます。

  4. [ ノード テンプレートの種類の選択 ] ページで、[ Azure ノード テンプレート] をクリックし、[ 次へ] をクリックします。

  5. [ テンプレート名の指定] ページで、ノード テンプレートの名前を入力し、必要に応じて説明を入力します。 [次へ] をクリックします。

  6. [ サブスクリプション情報の提供 ] ページで、ノードの追加に使用する Azure サブスクリプションの次の情報を指定します。

    1. [ サブスクリプション ID ] テキスト ボックスに、有効な Azure サブスクリプション アカウントの ID を入力するか貼り付けます。

    2. [ 管理証明書 ] テキスト ボックスに、コンピューター上の適切な証明書ストアにある秘密キーを含む証明書の拇印を入力、貼り付け、参照します。 続けて、 [次へ] をクリックします。

      • 拇印は、Azure サブスクリプションで構成されている管理証明書に対応する秘密キー証明書を識別する必要があります。
      • 拇印を入力または貼り付ける場合は、必ずすべてのスペースを削除してください。
      • [ 参照] をクリックすると、使用可能なサーバー認証証明書の一覧が表示されます。これには、コンピューターで構成した証明書が含まれます。 一覧で名前を選択して、対応する拇印を追加します。
      • HPC Pack のインストール時にヘッド ノードで自動的に生成された証明書を以前に構成した場合は、[ 参照 ] をクリックし、[ 既定の Microsoft HPC Azure Management] を選択します。 既定の Microsoft HPC Azure Management 証明書の使用については、「Azure バースト デプロイ用に Azure 管理証明書を構成するためのオプション」を参照してください。
      • 一覧に予想される証明書が表示されない場合、または選択した証明書にエラーがある場合は、「 証明書の問題のトラブルシューティング」を参照してください。

      Von Bedeutung

      ヘッド ノードで実行されているサービスが Azure に接続できない場合は、 The remote server returned an error: (403) Forbiddenのようなエラー メッセージが表示されることがあります。 これは、ネットワーク ファイアウォールの構成、ヘッド ノード上の管理証明書、またはネットワーク ファイアウォールと通信するプロキシ クライアントの構成に問題があることを示している可能性があります。 Azure と通信するように HPC Pack が正しく構成されていることを確認するには、「 Microsoft HPC Pack を使用して Azure ノードを追加するための要件」を参照してください。

  7. [ サービス情報の提供 ] ページで、ドロップダウン リストに表示される Azure クラウド サービス名とストレージ アカウント名を選択します。 [次へ] をクリックします。

  8. インストールされている HPC Pack のバージョンによっては、リモート デスクトップの資格情報や Azure 仮想ネットワークの名前など、テンプレートで追加の Azure 設定を構成できる場合があります。 これらの追加設定の詳細については、「 Microsoft HPC Pack 用の Azure Node テンプレートの構成」のヘルプ トピックを参照してください。

  9. [ Azure 可用性ポリシーの構成 ] ページで、Azure ノードの起動方法を選択し (これにより Azure でロール インスタンスがプロビジョニングされます)、停止します (これにより、Azure からロール インスタンスが削除されます)。

    1. ノードを手動で開始および停止する場合は、そのオプションを選択し、[ 次へ] をクリックします。 この手順の最後の手順に進みます。

    2. ノードを起動 (およびオンラインにする) し、自動的に停止する場合は、そのオプションを選択し、[ 可用性ポリシーの構成] をクリックします。 [ Azure 可用性ポリシーの構成 ] ダイアログ ボックスが表示されます。

    3. [ Azure 可用性ポリシーの構成 ] ダイアログ ボックスで、マウスをクリックしてドラッグし、ノードの開始と停止の日数と時間を選択します。

    4. 必要に応じて、ノードが停止するまでの分数を指定します (ノードで新しいジョブは開始されません)。

    5. 設定を保存するには、[ OK] をクリックし、[ 次へ] をクリックします。

      Von Bedeutung

      • 一部の条件下では Azure ロール インスタンスのデプロイには数分かかる場合があり、インスタンスの削除には数分かかる場合もあります。
      • ノードを自動的に開始および停止するオプションを選択した場合は、ノードをジョブの実行に使用できるようにする時間に加えて、ノードデプロイの各オンライン時間ブロックで追加の時間を計画します。 また、短い間隔でオンライン時間ブロックをスケジュールすることは避ける必要があります。
  10. ノード テンプレートを作成するには、[ レビュー ] ページで [ 作成] をクリックします。

Azure ノード テンプレートを編集するには

  1. HPC クラスター マネージャーの [構成]ナビゲーション ウィンドウで、[ ノード テンプレート] をクリックします。

  2. ビュー ウィンドウで、Azure ノード テンプレートを選択します。

  3. [操作] ウィンドウで、[編集] をクリックします。 [ ノード テンプレート エディター] ダイアログ ボックスが表示されます。

  4. 既存のテンプレート プロパティを変更するには、テンプレートの名前と説明を指定するか、[ 接続情報 ] やその他のタブで追加の設定を変更します。

  5. クラウド サービスの名前やストレージ アカウントなどの Azure 接続情報を検証するには、[ 接続情報 ] タブで [ 接続情報の検証] をクリックします。

  6. テンプレートの編集が完了したら、[ 保存] をクリックします。

その他の考慮事項

  • Azure ノード テンプレートでサブスクリプション情報を追加または検証するには、インターネット接続が必要であり、Azure の管理証明書が適切に構成されている必要があります。

  • 接続情報を編集しても、ノード テンプレートを使用して既にデプロイされている Azure ノードの接続設定には影響しません。 後で追加したノードのみが、テンプレートの新しい接続情報を使用します。

  • Azure ノード可用性ポリシーを編集すると、ノード テンプレートを使用して HPC クラスターに既に追加されているノードと、後で追加するノードのポリシーが変更されます。 たとえば、毎週のスケジュールに従って自動的に開始および停止するように構成された Azure ノードが手動で開始および停止するように構成されるように、Azure ノード テンプレートを編集できます。

    既存の Azure ノード テンプレートで自動可用性ポリシーを構成した後、このポリシーは、現在 Azure で開始 (プロビジョニング) されているがオフラインのノードには直ちに影響しません。 テンプレートで構成されている可用性間隔の 1 つ中にこの変更を行った場合、オフラインになっているプロビジョニング済みノードは、その期間中もその状態のままになります。 これらのノードはポリシーに従って自動的に停止しますが、以降の可用性間隔の開始時にのみ自動的に開始 (およびオンラインになります) されます。

  • Azure ノード テンプレートの可用性ポリシーの構成とジョブ スケジューラ構成の [タスクの猶予期間の取り消し] 設定に応じて、Azure ノードが停止され、デプロイが終了する正確な時刻は、オンライン時間ブロックのスケジュールされた終了と異なる場合があります。 これは、オンライン 時間ブロックの終わり近くで HPC タスクがまだ実行されている場合に発生する可能性があります。 詳細については、「 Azure Node 可用性ポリシーについて」を参照してください。

  • テンプレートで指定されているストレージ アカウントにファイル パッケージをアップロードできます。 たとえば、ノードで実行されるアプリケーションまたはサービス ファイルをアップロードできます。 これを行うと、ロール インスタンスが Azure にデプロイされるときに、パッケージがノードに自動的にインストールされます。 ファイルのパッケージ化とストレージ アカウントへのアップロードの詳細については、 hpcpack を参照してください。

手順 2: Windows HPC クラスターに Azure ノードを追加する

Azure ノード テンプレートを作成したら、ノードの追加ウィザードを使用してクラスターにノードを追加できます。

ノードを追加するには、Azure ノード テンプレートと次の情報を指定します。

  • ノードの数 ノードの起動時に Azure にデプロイされるロール インスタンスの数。 数が Azure のサブスクリプション内のロール インスタンスのクォータ内にあることを確認します。

  • ノードのサイズ HPC Pack で使用できる Azure の worker ロール インスタンス サイズの 1 つ。 サイズによって、CPU コアの数、メモリ容量、各ロール インスタンスのローカル ファイル システム サイズなどの特性が決まります。 詳細については、 バースト デプロイで使用できる Azure worker ロール インスタンスのサイズに関するページを参照してください

    HPC Pack 2012 R2 Update 1 以降では、HPC Pack によって自動的に検出され、サポートされる追加の worker ロール サイズが Azure で後で導入される場合に選択できます。

Azure ノードを追加するには

  1. HPC クラスター マネージャーの リソース管理 (一部のバージョンの HPC Pack では ノード管理 と呼ばれます) の [操作] ウィンドウで、[ ノードの追加] をクリックします。 ノードの追加ウィザードが表示されます。

  2. [ デプロイ方法の選択 ] ページで、[ Azure ノードの追加] をクリックし、[ 次へ] をクリックします。

  3. [ 新しいノードの指定 ] ページで、ノード テンプレートを選択し、ノードの数とサイズを指定して、[ 次へ] をクリックします。

  4. [ ノードの追加ウィザードの完了 ] ページで、[ 完了] をクリックします。

その他の考慮事項

  • Azure ノードを追加するには、 Add-HpcNodeSet HPC PowerShell コマンドレットを使用することもできます。

  • 追加後、Azure ノードは デプロイされていない 状態になり、ノードの正常性状態は 未承認になります。 ジョブを実行するために使用する前に、ジョブを開始 (プロビジョニング) してからオンラインにする必要があります。 ノードは、ノード テンプレートで指定されているように、手動または自動で起動され、オンラインになります。

  • 特定のノード テンプレートを使用してクラスターに追加されるすべての Azure ノードは、デプロイされるノードのセットを定義し、ノードを起動するときに Azure でまとめて管理できます。 これには、同じノード テンプレートを使用して後で追加する Azure ノードが含まれます。

  • 詳細については、「 Azure ノードの追加」を参照してください。

手順 3: Azure ノードを開始 (プロビジョニング) する

Azure でロール インスタンスをプロビジョニングするには、HPC クラスターに追加した Azure ノードを起動する必要があります。 次に、ノードをオンラインにして、クラスター ジョブを実行できるようにします。

ノードを起動してオンラインにする方法は、次のように Azure ノード テンプレートで構成した可用性ポリシーによって異なります。

  • 自動 ノードは、毎週 1 つ以上の間隔で 自動的にオンライン 状態に構成されます。 他のアクションを実行する必要はありません。

  • 手動 最初にノードを起動してから、それらをオンラインにして、クラスター ジョブを実行できるようにする必要があります。

Von Bedeutung

HPC Pack 2012 R2 Update 1 以降では、Azure で開始する 1 つ以上のノードを手動で選択します。 開始するように指定したノードは、複数の Azure ノードデプロイから取得できます。 以前のバージョンの HPC Pack では、1 つのノード テンプレートを使用してデプロイされたノードの完全なセットのみを開始できます。

特定の Azure ノードを手動で開始するには (HPC Pack 2012 R2 Update 1 で導入)

  1. リソース管理 (一部のバージョンの HPC Pack ではノード管理と呼ばれます) のナビゲーション ウィンドウで、[ノード] をクリックします。

  2. [リスト] ビューまたは [ヒート マップ] ビューで、開始する 1 つ以上の Azure ノードを選択します。

  3. [操作] ウィンドウで、[開始] をクリックします。 [ Azure ノードの開始 ] ダイアログ ボックスが表示されます。

  4. 開始プロセス中に、ノードの状態が [未デプロイ] から [ プロビジョニング] に変わります。 プロビジョニングの進行状況を追跡する場合は、ノードを選択し、[ 詳細] ウィンドウで [ プロビジョニング ログ ] タブをクリックします。

  5. ノードが正常に起動すると、ノードの状態がオフラインに変 わります

  6. ノードをオンラインにするには、 オフライン 状態のノードを選択して右クリックし、[ オンラインにする] をクリックします。

一連の Azure ノードを手動で起動してオンラインにするには (HPC Pack 2012 R2 以前のバージョン)

  1. リソース管理 (一部のバージョンの HPC Pack ではノード管理と呼ばれます) のナビゲーション ウィンドウで、[ノード] をクリックします。

  2. リスト ビューまたはヒート マップ ビューで、1 つ以上のノードを選択します。

  3. [操作] ウィンドウで、[開始] をクリックします。 [ Azure ノードの開始 ] ダイアログ ボックスが表示されます。

  4. 別のノード テンプレートを使用して追加されたノードを選択した場合は、開始するノードのセットを指定するノード テンプレートを選択します。 [ スタート] をクリックします。

  5. 開始プロセス中に、ノードの状態が [未デプロイ] から [ プロビジョニング] に変わります。 プロビジョニングの進行状況を追跡する場合は、ノードを選択し、[ 詳細] ウィンドウで [ プロビジョニング ログ ] タブをクリックします。

  6. ノードが正常に起動すると、ノードの状態がオフラインに変 わります

  7. ノードをオンラインにするには、 オフライン 状態のノードを選択して右クリックし、[ オンラインにする] をクリックします。

    HPC Pack 2008 R2 SP3 以降では、プロビジョニングを開始したノードのグループ内の他のノードがまだプロビジョニング状態であっても、ノードが プロビジョニング ノード状態から オフライン ノード状態に移行するとすぐに、一部のノードをオンラインにしてジョブの実行 開始できます。 この場合、ノードのグループ全体の正常性は引き続き Transitional として表示されます。 ノードの正常性が OK に移行するのを待つ必要はありません。

その他の考慮事項

  • 1 つのノード テンプレートを使用して追加された Azure ノードのセットを手動で開始するには、 Start-HpcNodeSet HPC PowerShell コマンドレットを使用することもできます。

  • HPC Pack 2012 R2 Update 1 以降では、指定された 1 つ以上の Azure ノードを手動で起動するために、 Start-HpcAzureNode HPC PowerShell コマンドレットを使用することもできます。

  • Azure ノードの開始には、ノードの数と Azure のパフォーマンスによっては、完了に時間がかかる場合があります。 この期間中、プロビジョニング ログの更新頻度が低い。 ノードの正常性が Transitional の間は、ノードのプロビジョニングを取り消すことができます。 1 つ以上のノードのプロビジョニング中にエラーが発生した場合、それらのノードの状態は [不明] に設定され、ノードの正常性は 未承認に設定されます。 エラーの原因を特定するには、プロビジョニング ログを確認します。 ロール インスタンスの状態に関する追加情報は、ポータルで確認できます。 ロール インスタンスで生成されたトレース ログ ファイルを確認することもできます。 詳細については、「 Microsoft HPC Pack を使用した Azure ノードのデプロイのトラブルシューティング」を参照してください。

  • 自動可用性ポリシーが構成されている場合、ノードは、Azure でロール インスタンスがプロビジョニングされた後にのみ、オンライン時間ブロックでジョブを実行できます。 ノードの開始 (およびオンライン化) のスケジュールされた時間には、Azure がロール インスタンスのプロビジョニングに要する時間は含まれません。

  • Azure のサブスクリプションは、ノードが使用可能な時間と、使用されるコンピューティング サービスとストレージ サービスに対して課金されます。 詳細については、Azure のサブスクリプションの使用条件を確認してください。

  • 一連の Azure ノードを開始するたびに、ヘッド ノードとノード間の通信を容易にするために、追加のプロキシ ロール インスタンスが Azure の HPC Pack によって自動的に構成されます。 プロキシ ロール インスタンスの数とサイズは、HPC Pack のバージョンによって異なります。 ノードがプロビジョニングされた後、プロキシ ロール インスタンスは HPC クラスター マネージャーに表示されません。 ただし、インスタンスはポータルに表示されます。 プロキシ ロール インスタンスは、Azure ノード インスタンスと共に Azure で料金が発生します。 詳細については、「 Azure プロキシ ノードの数を設定する」を参照してください。

手順 4: Azure ノードを停止する

Azure ノードのノード テンプレートで自動可用性ポリシーを構成した場合、ノードは自動的にオフラインになり、ポリシーの各オンライン タイム ブロックの最後に停止されます。 ノードを停止すると、シャットダウンされ、Azure クラウド サービスからインスタンスが削除され、クラスター内の 未デプロイ 状態にノードが返されます。

ノードの手動可用性ポリシーを構成した場合は、いつでも worker ロール インスタンスを手動で停止できます。 これを行って、使用されていない Azure リソースに対して課金されないようにすることができます。

Von Bedeutung

HPC Pack 2012 R2 以降では、Azure から特定のノードを手動で停止して、必要なくなった Azure ノードをスケールダウンできます。 停止するように指定したノードは、複数の Azure ノードデプロイから取得できます。 以前のバージョンの HPC Pack では、1 つのノード テンプレートを使用してデプロイされたノードの完全なセットのみを停止できます。

特定の Azure ノードを手動で停止するには (HPC Pack 2012 R2 で導入)

  1. リソース管理 (一部のバージョンの HPC Pack ではノード管理と呼ばれます) のナビゲーション ウィンドウで、[ノード] をクリックします。

  2. [リスト] ビューまたは [ヒート マップ] ビューで、停止する 1 つ以上の Azure ノードを選択します。

  3. [操作] ウィンドウで、[停止] をクリックします。 [ Azure ノードの停止 ] ダイアログ ボックスが表示されます。

  4. ノードで実行中のジョブを取り消してノードを直ちに停止する場合は、そのオプションを選択します。 それ以外の場合、実行中のジョブがドレインされた後、ノードは正常に停止します。 [ 停止] をクリックします。

  5. 停止中の進行状況を追跡する場合は、ノードを選択し、[ 詳細] ウィンドウで [ プロビジョニング ログ ] タブをクリックします。

一連の Azure ノードを手動で停止するには (HPC Pack 2012 以前のバージョン)

  1. リソース管理 (一部のバージョンの HPC Pack ではノード管理と呼ばれます) のナビゲーション ウィンドウで、[ノード] をクリックします。

  2. [リスト] ビューまたは [ヒート マップ] ビューで、1 つ以上の Azure ノードを選択します。

  3. [操作] ウィンドウで、[停止] をクリックします。 [ Azure ノードの停止 ] ダイアログ ボックスが表示されます。

  4. 別のノード テンプレートを使用して追加されたノードを選択した場合は、停止するノードのセットを指定するノード テンプレートを選択します。

  5. ノードで実行中のジョブを取り消してノードを直ちに停止する場合は、そのオプションを選択します。 それ以外の場合、実行中のジョブがドレインされた後、ノードは正常に停止します。 [ 停止] をクリックします。

  6. 停止中の進行状況を追跡する場合は、ノードを選択し、[ 詳細] ウィンドウで [ プロビジョニング ログ ] タブをクリックします。

その他の考慮事項

  • (単一の Azure ノード テンプレートを使用してデプロイされた) 一連の Azure ノードを手動で停止するには、 Stop-HpcNodeSet HPC PowerShell コマンドレットを使用することもできます。

  • 一連の Azure ノードを手動で停止してクラスターから削除する場合は、 Remove アクションまたは Remove-HpcNodeSet HPC PowerShell コマンドレットを使用できます。

  • Azure で一連のノードを停止または削除すると、完了するまで数分かかる場合があります。 クラウド サービス内のプロキシ ノードも、このプロセス中に削除されます。

  • HPC Pack 2012 R2 以降では、指定した Azure ノードを手動で停止または削除するために、 Stop-HpcAzureNode または Remove-HpcAzureNode HPC PowerShell コマンドレットを使用することもできます。

  • 停止または削除する必要があるのは、HPC クラスター マネージャーを使用することだけです。 ポータルやその他の Azure ツールを使用してロール インスタンスを削除しないでください。

こちらもご覧ください

Microsoft HPC Pack を使用して Azure Worker インスタンスにバーストする
Microsoft HPC Pack 用の Azure Node テンプレートの構成