次の方法で共有


ワークステーション ノードとアンマネージド サーバー ノードの可用性ポリシーについて

ワークステーション ノードとアンマネージド サーバー ノードをオンラインにしてジョブを実行し、手動または自動でオフラインにすることができます。 ワークステーション ノードと非管理対象サーバー ノードを自動的にオンラインおよびオフラインにする場合は、ノード テンプレートで週単位の可用性ポリシーを指定する必要があります。

ワークステーション ノードとアンマネージド サーバー ノードの両方が、HPC Pack 2008 R2 SP3 以降でサポートされています。 以前のバージョンの HPC Pack 2008 R2 では、ワークステーション ノードのみがサポートされています。

可用性ポリシーでは、クラスター ジョブを実行するためにノードが使用可能 (オンライン状態) になったときの各週の 1 つ以上の期間を指定します。 ノードをジョブの実行に使用できるようにする場合 (たとえば、平日は毎晩、週末は終日) は、毎週複数回指定できます。 クラスターは、各オンライン 時間ブロックの先頭にワークステーション ノードと非管理対象サーバー ノードを自動的にオンラインにします。 その後、ノードは、クラスターに送信されたジョブをすぐに実行できます。 各タイム ブロックの終了時に、ノードは自動的にオフラインになります。 必要に応じて、ワークステーション ノードとアンマネージド サーバー ノードで実行されているジョブがドレインされるときに、オンライン ブロックの終了までの時間間隔を指定できます。

お使いのバージョンの Microsoft HPC Pack でサポートされている場合は、テンプレートでユーザー アクティビティ検出設定を構成することもできます。 ユーザー アクティビティ検出設定により、クラスターは、オンライン 時間ブロック中に使用されていないワークステーション ノードと非管理対象サーバー ノード (キーボード、マウス、または CPU アクティビティに基づく) でのみジョブが実行されます。 詳細については、「 ユーザー アクティビティの検出について」を参照してください。

可用性ポリシーと [タスクの猶予期間の取り消し] 設定の相互作用

自動可用性ポリシーが構成されている場合、ワークステーション・ノードおよび非管理対象サーバー・ノードは、オンライン・タイム・ブロックが経過した後にジョブを開始しません。 ただし、[タスクの猶予期間の取り消し] 設定が構成されている場合、オンライン タイム ブロックの最後でまだ実行されている HPC タスクは、一定期間継続して実行できます。 タスクの猶予期間の取り消しクラスター プロパティを使用すると、アプリケーションは状態情報を保存し、終了する前の期間 (既定の期間は 15 秒) をクリーンアップできます。 タスクが終了する正確な時間は、タスクがCTRL_BREAK イベント (Ctrl + BREAK キーの組み合わせと同等) に応答するかどうかと、その応答速度によって異なります。 イベントを処理しないタスクは直ちに終了しますが、イベントを処理するタスクは、タスクキャンセル猶予期間が正常に終了するまでに時間がかかります。

タスクのキャンセル猶予期間は常にワークステーション ノードとアンマネージド サーバー ノードのオンライン タイム ブロックの終了時に開始されるため、タスクのキャンセル猶予期間 (またはタスクが CTRL_BREAK イベントを処理して停止するまで) に HPC タスクを実行し続ける場合があります。 ユーザーがノードでアクティビティを再開した後も、HPC タスクを続行できます。ただし、重複する可能性がある時間は短くなる可能性があります。

ワークステーション ノードでのタスクの猶予期間の取り消しの開始は、可用性ポリシーでのタスクのドレイン期間の構成の影響を受けません。

タスクのキャンセル猶予期間が構成されている場合に、スケジュールされていない時間帯にワークステーション ノードとアンマネージド サーバー ノードで HPC タスクを誤って実行しないようにするための推奨されるベスト プラクティスを次に示します。

  • タスクのキャンセル猶予期間の値を可能な限り小さく指定します (たとえば、分単位ではなく秒単位の値)。

  • タスクのキャンセル猶予期間を使用するワークステーション ノードで実行される HPC アプリケーションが、迅速にクリーンアップして終了できることを確認します。 CTRL_BREAK イベントを受け取った直後に終了しないアプリケーションは、タスクの猶予期間を取り消す限り実行を続行できます。

  • HPC Pack のバージョンでサポートされている場合は、可用性ポリシーでユーザー アクティビティ検出設定を構成します。 これらの設定は、HPC タスクがワークステーション上で正常以下の優先順位で実行されるようにするのに役立ち、タスクはワークステーションでユーザー アクティビティが検出されるとすぐにシステムを放棄します。

その他の考慮事項

  • 週単位の可用性ポリシーに従ってオンラインおよびオフラインにするように構成されているワークステーション ノードと非管理対象サーバー ノードは、手動でオンラインまたはオフラインにすることはできません。 これらのノードを手動でオンラインおよびオフラインにするように構成するには、別のワークステーション ノード テンプレートを割り当てるか、現在のワークステーション ノード テンプレートを変更する必要があります。

  • ノード テンプレートに加えられた変更は、テンプレートが割り当てられているすべてのワークステーション ノードとアンマネージド サーバー ノードに影響します。

  • ワークステーション ノードとアンマネージド サーバー ノードのグループごとに異なる可用性ポリシーを設定する場合は、各グループに適用する別のノード テンプレートを作成します。

こちらもご覧ください

ノードの状態、正常性、および操作について
ユーザー アクティビティの検出について
タスクの猶予期間の取り消し