RScriptStep クラス
注
これは試験的なクラスであり、いつでも変更される可能性があります。 詳細については、https://aka.ms/azuremlexperimental を参照してください。
R スクリプトを実行する Azure ML パイプライン ステップを作成します。
R スクリプトを実行する Azure ML パイプライン ステップを作成します。
廃止。 代わりに CommandStep を使用してください。 例については、「 CommandStep を使用してパイプラインで R スクリプトを実行する方法」を参照してください。
コンストラクター
RScriptStep(script_name, name=None, arguments=None, compute_target=None, runconfig=None, runconfig_pipeline_params=None, inputs=None, outputs=None, params=None, source_directory=None, use_gpu=False, custom_docker_image=None, cran_packages=None, github_packages=None, custom_url_packages=None, allow_reuse=True, version=None)
パラメーター
名前 | 説明 |
---|---|
script_name
必須
|
[必須] |
name
必須
|
ステップの名前。 指定しない場合は、 |
arguments
必須
|
R スクリプト ファイルのコマンド ライン引数。 引数は、RunConfiguration の |
compute_target
必須
|
[必須]使用するコンピューティング先。 指定しない場合は、 |
runconfig
必須
|
[必須]実験でトレーニング実行を送信するために必要な情報をカプセル化する実行構成。 これは、 RSectionで定義できる R 実行構成を定義するために必要です。 この手順では、RSection が必要です。 |
runconfig_pipeline_params
必須
|
キーと値のペアをそれぞれ runconfig プロパティの名前を持ち、そのプロパティの PipelineParameter を使用して実行時に runconfig プロパティをオーバーライドします。 サポートされている値: 'NodeCount'、'MpiProcessCountPerNode'、'TensorflowWorkerCount'、'TensorflowParameterServerCount' |
inputs
必須
|
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputFileDataset, PipelineOutputTabularDataset, DatasetConsumptionConfig]]
入力ポート バインドの一覧。 |
outputs
必須
|
出力ポート バインドの一覧。 |
params
必須
|
環境変数として "AML_PARAMETER_" で登録された名前と値のペアのディクショナリ。 |
source_directory
必須
|
手順で使用する R スクリプト、conda env、およびその他のリソースを含むフォルダー。 |
use_gpu
必須
|
実験を実行する環境が GPU をサポートする必要があるかどうかを示します。
True の場合、GPU ベースの既定の Docker イメージが環境で使用されます。 False の場合、CPU ベースのイメージが使用されます。 既定の Docker イメージ (CPU または GPU) は、ユーザーが |
custom_docker_image
必須
|
トレーニングに使用するイメージのビルド元となる Docker イメージの名前。 設定しない場合は、既定の CPU ベースのイメージが基本イメージとして使用されます。 これは非推奨となり、今後のリリースで削除される予定です。 代わりに、DockerSection でbase_imageを使用してください。 |
cran_packages
必須
|
インストールする CRAN パッケージ。 これは非推奨となり、今後のリリースで削除される予定です。 代わりにRSection.cran_packagesを使用してください。 |
github_packages
必須
|
インストールする GitHub パッケージ。 これは非推奨となり、今後のリリースで削除される予定です。 代わりにRSection.github_packagesを使用してください。 |
custom_url_packages
必須
|
ローカル、ディレクトリ、またはカスタム URL からインストールするパッケージ。 これは非推奨となり、今後のリリースで削除される予定です。 代わりにRSection.custom_url_packagesを使用してください。 |
allow_reuse
必須
|
同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。 ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。 |
version
必須
|
ステップの機能の変更を示すオプションのバージョン タグ。 |
script_name
必須
|
[必須] |
name
必須
|
ステップの名前。 指定しない場合は、 |
arguments
必須
|
R スクリプト ファイルのコマンド ライン引数。 引数は、RunConfiguration の |
compute_target
必須
|
[必須]使用するコンピューティング先。 指定しない場合は、 |
runconfig
必須
|
[必須]実験でトレーニング実行を送信するために必要な情報をカプセル化する実行構成。 これは、 RSectionで定義できる R 実行構成を定義するために必要です。 この手順では、RSection が必要です。 |
runconfig_pipeline_params
必須
|
キーと値のペアをそれぞれ runconfig プロパティの名前を持ち、そのプロパティの PipelineParameter を使用して実行時に runconfig プロパティをオーバーライドします。 サポートされている値: 'NodeCount'、'MpiProcessCountPerNode'、'TensorflowWorkerCount'、'TensorflowParameterServerCount' |
inputs
必須
|
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputFileDataset, PipelineOutputTabularDataset, DatasetConsumptionConfig]]
入力ポート バインドの一覧。 |
outputs
必須
|
出力ポート バインドの一覧。 |
params
必須
|
環境変数として "AML_PARAMETER_" で登録された名前と値のペアのディクショナリ。 |
source_directory
必須
|
手順で使用する R スクリプト、conda env、およびその他のリソースを含むフォルダー。 |
use_gpu
必須
|
実験を実行する環境が GPU をサポートする必要があるかどうかを示します。
True の場合、GPU ベースの既定の Docker イメージが環境で使用されます。 False の場合、CPU ベースのイメージが使用されます。 既定の Docker イメージ (CPU または GPU) は、ユーザーが |
custom_docker_image
必須
|
トレーニングに使用するイメージのビルド元となる Docker イメージの名前。 設定しない場合は、既定の CPU ベースのイメージが基本イメージとして使用されます。 これは非推奨となり、今後のリリースで削除される予定です。 代わりに、DockerSection でbase_imageを使用してください。 |
cran_packages
必須
|
インストールする CRAN パッケージ。 これは非推奨となり、今後のリリースで削除される予定です。 代わりにRSection.cran_packagesを使用してください。 |
github_packages
必須
|
インストールする GitHub パッケージ。 これは非推奨となり、今後のリリースで削除される予定です。 代わりにRSection.github_packagesを使用してください。 |
custom_url_packages
必須
|
ローカル、ディレクトリ、またはカスタム URL からインストールするパッケージ。 これは非推奨となり、今後のリリースで削除される予定です。 代わりにRSection.custom_url_packagesを使用してください。 |
allow_reuse
必須
|
同じ設定で再実行するときに、前の結果をステップで再利用するかどうかを示します。 再利用は既定で有効になっています。 ステップの内容 (スクリプト/依存関係) と入力とパラメーターが変更されていない場合は、この手順の前の実行からの出力が再利用されます。 ステップを再利用すると、ジョブをコンピューティングに送信する代わりに、前の実行の結果が後続のステップですぐに使用できるようになります。 Azure Machine Learning データセットを入力として使用する場合、再利用は、基になるデータが変更されたかどうかではなく、データセットの定義が変更されたかどうかによって決まります。 |
version
必須
|
ステップの機能の変更を示すオプションのバージョン タグ。 |
注釈
RScriptStep は、コンピューティング 先で R スクリプトを実行するための基本的な組み込み手順です。 スクリプト名とその他の省略可能なパラメーター (スクリプトの引数、コンピューティング ターゲット、入力、出力など) を受け取ります。 RunConfigurationを使用して、カスタム Docker イメージ、必須の cran/github パッケージなど、RScriptStep の要件を指定する必要があります。
RScriptStep を使用する場合のベスト プラクティスは、スクリプトとステップに関連付けられている依存ファイルに別のフォルダーを使用し、そのフォルダーを source_directory
パラメーターで指定することです。
このベスト プラクティスに従う場合、2 つの利点があります。 1 つ目は、ステップに必要なスナップショットのみがスナップショットされるため、ステップ用に作成されるスナップショットのサイズを小さくするのに役立ちます。 次に、スナップショットの再アップロードをトリガーする source_directory
に変更がない場合は、前の実行からのステップの出力を再利用できます。
次のコード例は、機械学習トレーニング シナリオで RScriptStep を使用する方法を示しています。
from azureml.core.runconfig import RunConfiguration
from azureml.core.environment import Environment, RSection, RCranPackage
from azureml.pipeline.steps import RScriptStep
rc = RunConfiguration()
rc.framework='R'
rc.environment.r = RSection() # R details with required packages
rc.environment.docker.enabled = True # to enable docker image
rc.environment.docker.base_image = '<custom user image>' # to use custom image
cran_package1 = RCranPackage()
cran_package1.name = "ggplot2"
cran_package1.repository = "www.customurl.com"
cran_package1.version = "2.1"
rc.environment.r.cran_packages = [cran_package1]
trainStep = RScriptStep(script_name="train.R",
arguments=["--input", blob_input_data, "--output", output_data1],
inputs=[blob_input_data],
outputs=[output_data1],
compute_target=compute_target,
use_gpu=False,
runconfig=rc,
source_directory=project_folder)
一般的なパイプラインの作成の詳細については、 https://aka.ms/pl-first-pipeline を参照してください。 RSection の詳細については、 https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.environment.rsection を参照してください。
メソッド
create_node |
RScriptStep のノードを作成し、指定したグラフに追加します。 廃止。 代わりに CommandStep を使用してください。 例については、「 CommandStep を使用してパイプラインで R スクリプトを実行する方法」を参照してください。 このメソッドは、直接使用するためのものではありません。 この手順でパイプラインがインスタンス化されると、Azure ML は、このメソッドに必要なパラメーターを自動的に渡して、そのステップをワークフローを表すパイプライン グラフに追加できるようにします。 |
create_node
RScriptStep のノードを作成し、指定したグラフに追加します。
廃止。 代わりに CommandStep を使用してください。 例については、「 CommandStep を使用してパイプラインで R スクリプトを実行する方法」を参照してください。
このメソッドは、直接使用するためのものではありません。 この手順でパイプラインがインスタンス化されると、Azure ML は、このメソッドに必要なパラメーターを自動的に渡して、そのステップをワークフローを表すパイプライン グラフに追加できるようにします。
create_node(graph, default_datastore, context)
パラメーター
名前 | 説明 |
---|---|
graph
必須
|
ノードを追加するグラフ オブジェクト。 |
default_datastore
必須
|
既定のデータストア。 |
context
必須
|
<xref:azureml.pipeline.core._GraphContext>
グラフ コンテキスト。 |
戻り値
型 | 説明 |
---|---|
作成されたノード。 |