AzureBatchStep クラス
Azure Batch にジョブを送信するための Azure ML パイプライン ステップを作成します。
注: この手順では、ディレクトリとその内容のアップロード/ダウンロードはサポートされていません。
AzureBatchStep の使用例については、ノートブックの https://aka.ms/pl-azbatchを参照してください。
Azure Batch にジョブを送信するための Azure ML パイプライン ステップを作成します。
コンストラクター
AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)
パラメーター
名前 | 説明 |
---|---|
name
必須
|
[必須]ステップの名前。 |
create_pool
|
ジョブを実行する前にプールを作成するかどうかを示します。 規定値: False
|
pool_id
|
[必須]ジョブが実行されるプールの ID。 ID には、既存のプール、またはジョブの送信時に作成されるプールを指定できます。 規定値: None
|
delete_batch_job_after_finish
|
完了した後に Batch アカウントからジョブを削除するかどうかを示します。 規定値: True
|
delete_batch_pool_after_finish
|
ジョブの完了後にプールを削除するかどうかを示します。 規定値: False
|
is_positive_exit_code_failure
|
タスクが正のコードで存在する場合にジョブが失敗するかどうかを示します。 規定値: True
|
vm_image_urn
|
規定値: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
|
run_task_as_admin
|
タスクを管理者特権で実行するかどうかを示します。 規定値: False
|
target_compute_nodes
|
規定値: 1
|
vm_size
|
規定値: standard_d1_v2
|
source_directory
|
モジュール バイナリ、実行可能ファイル、アセンブリなどを含むローカル フォルダー。 規定値: None
|
executable
|
[必須]ジョブの一部として実行されるコマンド/実行可能ファイルの名前。 規定値: None
|
arguments
|
コマンド/実行可能ファイルの引数。 規定値: None
|
inputs
|
入力ポート バインドの一覧。 ジョブを実行する前に、入力ごとにフォルダーが作成されます。 各入力のファイルは、ストレージからコンピューティング ノード上のそれぞれのフォルダーにコピーされます。 たとえば、入力名が input1 で、ストレージの相対パスが 一部/相対/パス/その/できる/実際に/長い/inputfile.txtである場合、コンピューティング上のファイル パスは ./input1/inputfile.txtになります。 入力名が 32 文字を超えると、切り捨てられ、一意のサフィックスが付加されるため、コンピューティング 先でフォルダー名を正常に作成できます。 規定値: None
|
outputs
|
出力ポート バインドの一覧。 入力と同様に、ジョブを実行する前に、出力ごとにフォルダーが作成されます。 フォルダー名は出力名と同じになります。 ジョブがそのフォルダーに出力を配置することを前提とします。 規定値: None
|
allow_reuse
|
同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。 ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。 規定値: True
|
compute_target
|
[必須]ジョブが実行される BatchCompute コンピューティング。 規定値: None
|
version
|
モジュールの機能の変更を示すオプションのバージョン タグ。 規定値: None
|
name
必須
|
[必須]ステップの名前。 |
create_pool
必須
|
ジョブを実行する前にプールを作成するかどうかを示します。 |
pool_id
必須
|
[必須]ジョブが実行されるプールの ID。 ID には、既存のプール、またはジョブの送信時に作成されるプールを指定できます。 |
delete_batch_job_after_finish
必須
|
完了した後に Batch アカウントからジョブを削除するかどうかを示します。 |
delete_batch_pool_after_finish
必須
|
ジョブの完了後にプールを削除するかどうかを示します。 |
is_positive_exit_code_failure
必須
|
タスクが正のコードで存在する場合にジョブが失敗するかどうかを示します。 |
vm_image_urn
必須
|
|
run_task_as_admin
必須
|
タスクを管理者特権で実行するかどうかを示します。 |
target_compute_nodes
必須
|
|
vm_size
必須
|
|
source_directory
必須
|
モジュール バイナリ、実行可能ファイル、アセンブリなどを含むローカル フォルダー。 |
executable
必須
|
[必須]ジョブの一部として実行されるコマンド/実行可能ファイルの名前。 |
arguments
必須
|
コマンド/実行可能ファイルの引数。 |
inputs
必須
|
入力ポート バインドの一覧。 ジョブを実行する前に、入力ごとにフォルダーが作成されます。 各入力のファイルは、ストレージからコンピューティング ノード上のそれぞれのフォルダーにコピーされます。 たとえば、入力名が input1 で、ストレージの相対パスが 一部/相対/パス/その/できる/実際に/長い/inputfile.txtである場合、コンピューティング上のファイル パスは ./input1/inputfile.txtになります。 入力名が 32 文字を超える場合は、切り捨てられ、一意のサフィックスが付加されるため、コンピューティングでフォルダー名が正常に作成される可能性があります。 |
outputs
必須
|
出力ポート バインドの一覧。 入力と同様に、ジョブを実行する前に、出力ごとにフォルダーが作成されます。 フォルダー名は出力名と同じになります。 ジョブがそのフォルダーに出力されることを前提とします。 |
allow_reuse
必須
|
同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。 ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。 |
compute_target
必須
|
[必須]ジョブが実行される BatchCompute コンピューティング。 |
version
必須
|
モジュールの機能の変更を示すオプションのバージョン タグ。 |
注釈
次の例は、Azure Machine Learning パイプラインで AzureBatchStep を使用する方法を示しています。
step = AzureBatchStep(
name="Azure Batch Job",
pool_id="MyPoolName", # Replace this with the pool name of your choice
inputs=[testdata],
outputs=[outputdata],
executable="azurebatch.cmd",
arguments=[testdata, outputdata],
compute_target=batch_compute,
source_directory=binaries_folder,
)
メソッド
create_node |
AzureBatch ステップからノードを作成し、指定したグラフに追加します。 このメソッドは、直接使用するためのものではありません。 この手順でパイプラインがインスタンス化されると、Azure ML は、このメソッドに必要なパラメーターを自動的に渡して、そのステップをワークフローを表すパイプライン グラフに追加できるようにします。 |
create_node
AzureBatch ステップからノードを作成し、指定したグラフに追加します。
このメソッドは、直接使用するためのものではありません。 この手順でパイプラインがインスタンス化されると、Azure ML は、このメソッドに必要なパラメーターを自動的に渡して、そのステップをワークフローを表すパイプライン グラフに追加できるようにします。
create_node(graph, default_datastore, context)
パラメーター
名前 | 説明 |
---|---|
graph
必須
|
ノードを追加するグラフ オブジェクト。 |
default_datastore
必須
|
既定のデータストア。 |
context
必須
|
<xref:azureml.pipeline.core._GraphContext>
グラフ コンテキスト。 |
戻り値
型 | 説明 |
---|---|
作成されたノード。 |