次の方法で共有


AzureBatchStep クラス

Azure Batch にジョブを送信するための Azure ML パイプライン ステップを作成します。

注: この手順では、ディレクトリとその内容のアップロード/ダウンロードはサポートされていません。

AzureBatchStep の使用例については、ノートブックの https://aka.ms/pl-azbatchを参照してください。

Azure Batch にジョブを送信するための Azure ML パイプライン ステップを作成します。

コンストラクター

AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)

パラメーター

名前 説明
name
必須
str

[必須]ステップの名前。

create_pool

ジョブを実行する前にプールを作成するかどうかを示します。

規定値: False
pool_id
str

[必須]ジョブが実行されるプールの ID。 ID には、既存のプール、またはジョブの送信時に作成されるプールを指定できます。

規定値: None
delete_batch_job_after_finish

完了した後に Batch アカウントからジョブを削除するかどうかを示します。

規定値: True
delete_batch_pool_after_finish

ジョブの完了後にプールを削除するかどうかを示します。

規定値: False
is_positive_exit_code_failure

タスクが正のコードで存在する場合にジョブが失敗するかどうかを示します。

規定値: True
vm_image_urn
str

create_poolが True の場合、VM は VirtualMachineConfiguration を使用します。 値の形式: urn:publisher:offer:sku。 例: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter

規定値: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
run_task_as_admin

タスクを管理者特権で実行するかどうかを示します。

規定値: False
target_compute_nodes
int

create_poolが True の場合は、プールに追加されるコンピューティング ノードの数を示します。

規定値: 1
vm_size
str

create_poolが True の場合は、コンピューティング ノードの仮想マシン のサイズを示します。

規定値: standard_d1_v2
source_directory
str

モジュール バイナリ、実行可能ファイル、アセンブリなどを含むローカル フォルダー。

規定値: None
executable
str

[必須]ジョブの一部として実行されるコマンド/実行可能ファイルの名前。

規定値: None
arguments
str

コマンド/実行可能ファイルの引数。

規定値: None
inputs

入力ポート バインドの一覧。 ジョブを実行する前に、入力ごとにフォルダーが作成されます。 各入力のファイルは、ストレージからコンピューティング ノード上のそれぞれのフォルダーにコピーされます。 たとえば、入力名が input1 で、ストレージの相対パスが 一部/相対/パス/その/できる/実際に/長い/inputfile.txtである場合、コンピューティング上のファイル パスは ./input1/inputfile.txtになります。 入力名が 32 文字を超えると、切り捨てられ、一意のサフィックスが付加されるため、コンピューティング 先でフォルダー名を正常に作成できます。

規定値: None
outputs

出力ポート バインドの一覧。 入力と同様に、ジョブを実行する前に、出力ごとにフォルダーが作成されます。 フォルダー名は出力名と同じになります。 ジョブがそのフォルダーに出力を配置することを前提とします。

規定値: None
allow_reuse

同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。 ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。

規定値: True
compute_target

[必須]ジョブが実行される BatchCompute コンピューティング。

規定値: None
version
str

モジュールの機能の変更を示すオプションのバージョン タグ。

規定値: None
name
必須
str

[必須]ステップの名前。

create_pool
必須

ジョブを実行する前にプールを作成するかどうかを示します。

pool_id
必須
str

[必須]ジョブが実行されるプールの ID。 ID には、既存のプール、またはジョブの送信時に作成されるプールを指定できます。

delete_batch_job_after_finish
必須

完了した後に Batch アカウントからジョブを削除するかどうかを示します。

delete_batch_pool_after_finish
必須

ジョブの完了後にプールを削除するかどうかを示します。

is_positive_exit_code_failure
必須

タスクが正のコードで存在する場合にジョブが失敗するかどうかを示します。

vm_image_urn
必須
str

create_poolが True の場合、VM は VirtualMachineConfiguration を使用します。 値の形式: urn:publisher:offer:sku。 例: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter

run_task_as_admin
必須

タスクを管理者特権で実行するかどうかを示します。

target_compute_nodes
必須
int

create_poolが True の場合は、プールに追加されるコンピューティング ノードの数を示します。

vm_size
必須
str

create_poolが True の場合は、コンピューティング ノードの仮想マシン のサイズを示します。

source_directory
必須
str

モジュール バイナリ、実行可能ファイル、アセンブリなどを含むローカル フォルダー。

executable
必須
str

[必須]ジョブの一部として実行されるコマンド/実行可能ファイルの名前。

arguments
必須

コマンド/実行可能ファイルの引数。

inputs
必須

入力ポート バインドの一覧。 ジョブを実行する前に、入力ごとにフォルダーが作成されます。 各入力のファイルは、ストレージからコンピューティング ノード上のそれぞれのフォルダーにコピーされます。 たとえば、入力名が input1 で、ストレージの相対パスが 一部/相対/パス/その/できる/実際に/長い/inputfile.txtである場合、コンピューティング上のファイル パスは ./input1/inputfile.txtになります。 入力名が 32 文字を超える場合は、切り捨てられ、一意のサフィックスが付加されるため、コンピューティングでフォルダー名が正常に作成される可能性があります。

outputs
必須

出力ポート バインドの一覧。 入力と同様に、ジョブを実行する前に、出力ごとにフォルダーが作成されます。 フォルダー名は出力名と同じになります。 ジョブがそのフォルダーに出力されることを前提とします。

allow_reuse
必須

同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。 ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。

compute_target
必須

[必須]ジョブが実行される BatchCompute コンピューティング。

version
必須
str

モジュールの機能の変更を示すオプションのバージョン タグ。

注釈

次の例は、Azure Machine Learning パイプラインで AzureBatchStep を使用する方法を示しています。


   step = AzureBatchStep(
               name="Azure Batch Job",
               pool_id="MyPoolName", # Replace this with the pool name of your choice
               inputs=[testdata],
               outputs=[outputdata],
               executable="azurebatch.cmd",
               arguments=[testdata, outputdata],
               compute_target=batch_compute,
               source_directory=binaries_folder,
   )

完全なサンプルは次から入手できます https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb

メソッド

create_node

AzureBatch ステップからノードを作成し、指定したグラフに追加します。

このメソッドは、直接使用するためのものではありません。 この手順でパイプラインがインスタンス化されると、Azure ML は、このメソッドに必要なパラメーターを自動的に渡して、そのステップをワークフローを表すパイプライン グラフに追加できるようにします。

create_node

AzureBatch ステップからノードを作成し、指定したグラフに追加します。

このメソッドは、直接使用するためのものではありません。 この手順でパイプラインがインスタンス化されると、Azure ML は、このメソッドに必要なパラメーターを自動的に渡して、そのステップをワークフローを表すパイプライン グラフに追加できるようにします。

create_node(graph, default_datastore, context)

パラメーター

名前 説明
graph
必須

ノードを追加するグラフ オブジェクト。

default_datastore
必須

既定のデータストア。

context
必須
<xref:azureml.pipeline.core._GraphContext>

グラフ コンテキスト。

戻り値

説明

作成されたノード。