次の方法で共有


steps パッケージ

Azure Machine Learning パイプラインで実行できる事前構築済みの手順が含まれています。

Azure ML パイプラインの手順を一緒に構成して、共有可能で再利用可能な Azure Machine Learning ワークフローを表すパイプラインを構築できます。 パイプラインの各ステップは、ステップの内容 (スクリプトと依存関係) と入力とパラメーターが変更されていない場合に、前の実行結果を再利用できるように構成できます。

このパッケージのクラスは、通常、 core パッケージ内のクラスと共に使用されます。 コア パッケージには、データの構成 (PipelineData)、スケジュール設定 (Schedule)、ステップの出力の管理 (StepRun) のクラスが含まれています。

このパッケージの事前構築済みの手順では、機械学習ワークフローで発生する多くの一般的なシナリオについて説明します。 事前構築済みパイプラインの手順を開始するには、次を参照してください。

モジュール

adla_step

Azure Data Lake Analytics で U-SQL スクリプトを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

automl_step

Azure Machine Learning で自動 ML パイプライン ステップを追加および管理するための機能が含まれています。

azurebatch_step

Azure Batch で Windows 実行可能ファイルを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

command_step

コマンドを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

data_transfer_step

ストレージ オプション間でデータを転送する Azure ML パイプライン ステップを作成する機能が含まれています。

databricks_step

DBFS で Databricks ノートブックまたは Python スクリプトを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

estimator_step

Machine Learning モデル トレーニング用の Estimator を実行するパイプライン ステップを作成する機能が含まれています。

hyper_drive_step

ハイパーパラメーター調整を実行する Azure ML パイプラインステップを作成および管理するための機能が含まれています。

kusto_step

Kusto ノートブックを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

module_step

モジュールの既存のバージョンを使用して Azure Machine Learning パイプライン ステップを追加する機能が含まれています。

mpi_step

Machine Learning モデル トレーニング用の MPI ジョブを実行する Azure ML パイプライン ステップを追加する機能が含まれています。

parallel_run_config

ParallelRunStepを構成するための機能が含まれています。

parallel_run_step

複数の AmlCompute ターゲットでユーザー スクリプトを並列モードで実行するステップを追加する機能が含まれています。

python_script_step

Python スクリプトを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

r_script_step

R スクリプトを実行する Azure ML パイプライン ステップを作成する機能が含まれています。

synapse_spark_step

Python スクリプトを実行する Azure ML Synapse ステップを作成する機能が含まれています。

クラス

AdlaStep

Azure Data Lake Analytics を使用して U-SQL スクリプトを実行する Azure ML パイプライン ステップを作成します。

この AdlaStep の使用例については、ノートブックの https://aka.ms/pl-adlaを参照してください。

Azure Data Lake Analytics を使用して U-SQL スクリプトを実行する Azure ML パイプライン ステップを作成します。

AutoMLStep

自動 ML 実行をカプセル化する Azure ML パイプライン ステップを作成します。

AutoMLStep の使用例については、ノートブックの https://aka.ms/pl-automlを参照してください。

AutoMLStep を初期化します。

AutoMLStepRun

自動 ML 実験の実行と、既定の出力を取得するためのメソッドに関する情報を提供します。

AutoMLStepRun クラスは、パイプラインで自動 ML 実行が送信されると、実行の詳細を管理、確認、および取得するために使用されます。 さらに、このクラスを使用して、AutoMLStep クラスを介してStepRunの既定の出力を取得できます。

automl ステップ実行を初期化します。

AzureBatchStep

Azure Batch にジョブを送信するための Azure ML パイプライン ステップを作成します。

注: この手順では、ディレクトリとその内容のアップロード/ダウンロードはサポートされていません。

AzureBatchStep の使用例については、ノートブックの https://aka.ms/pl-azbatchを参照してください。

Azure Batch にジョブを送信するための Azure ML パイプライン ステップを作成します。

CommandStep

コマンドを実行する Azure ML パイプライン ステップを作成します。

コマンドを実行する Azure ML パイプライン ステップを作成します。

DataTransferStep

ストレージ オプション間でデータを転送する Azure ML パイプライン ステップを作成します。

DataTransferStep では、ソースとシンクとして Azure Blob Storage や Azure Data Lake などの一般的なストレージの種類がサポートされています。 詳細については、「解説」セクション 参照してください。

DataTransferStep の使用例については、ノートブックの https://aka.ms/pl-data-transを参照してください。

ストレージ オプション間でデータを転送する Azure ML パイプライン ステップを作成します。

DatabricksStep

DataBricks ノートブック、Python スクリプト、または JAR をノードとして追加する Azure ML パイプライン ステップを作成します。

DatabricksStep の使用例については、ノートブックの https://aka.ms/pl-databricksを参照してください。

DataBricks ノートブック、Python スクリプト、または JAR をノードとして追加する Azure ML パイプライン ステップを作成します。

DatabricksStep の使用例については、ノートブックの https://aka.ms/pl-databricksを参照してください。

:p aram python_script_name:[必須] source_directoryを基準とした Python スクリプトの名前。 スクリプトが入力と出力を受け取る場合、それらはパラメーターとしてスクリプトに渡されます。 python_script_nameを指定する場合は、source_directoryも指定する必要があります。

notebook_pathpython_script_pathpython_script_name、またはmain_class_nameのいずれかを指定します。

data_reference_name=input1 の入力として DataReference オブジェクトを指定し、name=output1 の出力として PipelineData オブジェクトを指定した場合、入力と出力はパラメーターとしてスクリプトに渡されます。 次のように表示され、スクリプト内の引数を解析して、各入力と出力のパスにアクセスする必要があります。 "-input1"、"wasbs://test@storagename.blob.core.windows.net/test"、"-output1"、"wasbs://test@storagename.blob.core.windows.net/b3e26de1-87a4-494d-a20f-1988d22b81a2/output1"

さらに、スクリプト内で次のパラメーターを使用できます。

  • AZUREML_RUN_TOKEN: Azure Machine Learning で認証するための AML トークン。
  • AZUREML_RUN_TOKEN_EXPIRY: AML トークンの有効期限。
  • AZUREML_RUN_ID: この実行の Azure Machine Learning 実行 ID。
  • AZUREML_ARM_SUBSCRIPTION: AML ワークスペースの Azure サブスクリプション。
  • AZUREML_ARM_RESOURCEGROUP: Azure Machine Learning ワークスペースの Azure リソース グループ。
  • AZUREML_ARM_WORKSPACE_NAME: Azure Machine Learning ワークスペースの名前。
  • AZUREML_ARM_PROJECT_NAME: Azure Machine Learning 実験の名前。
  • AZUREML_SERVICE_ENDPOINT: AML サービスのエンドポイント URL。
  • AZUREML_WORKSPACE_ID: Azure Machine Learning ワークスペースの ID。
  • AZUREML_EXPERIMENT_ID: Azure Machine Learning 実験の ID。
  • AZUREML_SCRIPT_DIRECTORY_NAME: source_directoryがコピーされた DBFS のディレクトリ パス。
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

DatabricksStep パラメーター source_directorypython_script_nameを使用して Databricks 上のローカル コンピューターから Python スクリプトを実行する場合、source_directoryは DBFS にコピーされ、DBFS のディレクトリ パスは実行を開始するときにパラメーターとしてスクリプトに渡されます。 このパラメーターには 、-AZUREML_SCRIPT_DIRECTORY_NAME というラベルが付けられます。 DBFS 内のディレクトリにアクセスするには、文字列 "dbfs:/" または "/dbfs/" のプレフィックスを付ける必要があります。

EstimatorStep

廃止。 Azure ML モデル トレーニングの Estimator を実行するパイプライン ステップを作成します。

Machine Learning モデル トレーニング用の Estimator を実行する Azure ML パイプライン ステップを作成します。

廃止。 代わりに CommandStep を使用してください。 例については、「 CommandStep を使用してパイプラインで ML トレーニングを実行する方法」を参照してください。

HyperDriveStep

Machine Learning モデル トレーニング用のハイパーパラメーター チューニングを実行する Azure ML パイプライン ステップを作成します。

HyperDriveStep の使用例については、ノートブックの https://aka.ms/pl-hyperdriveを参照してください。

Machine Learning モデル トレーニング用のハイパーパラメーターチューニングを実行する Azure ML パイプライン ステップを作成します。

HyperDriveStepRun

HyperDriveStep パイプライン ステップの管理、状態の確認、実行の詳細の取得。

HyperDriveStepRun は、HyperDriveRunの追加サポートを備えたStepRunの機能を提供します。 HyperDriveStepRun クラスを使用すると、HyperDrive の実行とその生成された各子実行の実行の詳細を管理、確認、および取得できます。 StepRun クラスを使用すると、親パイプラインの実行が送信され、パイプラインがステップ実行を送信した後にこれを行うことができます。

HyperDriveStepRun を初期化します。

HyperDriveStepRun は、HyperDriveRunの追加サポートを備えたStepRunの機能を提供します。 HyperDriveRun クラスを使用すると、HyperDrive の実行とその生成された各子実行の管理、状態の確認、実行の詳細の取得を行えます。 StepRun クラスを使用すると、親パイプラインの実行が送信され、パイプラインがステップ実行を送信した後にこれを行うことができます。

KustoStep

KustoStep を使用すると、Azure ML Pipelines のターゲット Kusto クラスターで Kusto クエリを実行できます。

KustoStep を初期化します。

ModuleStep

モジュールの特定のバージョンを実行する Azure Machine Learning パイプライン ステップを作成します。

Module オブジェクトは、さまざまな機械学習シナリオや異なるユーザーが使用できる再利用可能な計算 (スクリプトや実行可能ファイルなど) を定義します。 パイプラインで特定のバージョンのモジュールを使用するには、ModuleStep を作成します。 ModuleStep は、既存の ModuleVersionを使用するパイプラインのステップです。

ModuleStep の使用例については、ノートブックの https://aka.ms/pl-modulestepを参照してください。

モジュールの特定のバージョンを実行する Azure ML パイプライン ステップを作成します。

MpiStep

MPI ジョブを実行する Azure ML パイプライン ステップを作成します。

MpiStep の使用例については、ノートブックの https://aka.ms/pl-style-transを参照してください。

MPI ジョブを実行する Azure ML パイプライン ステップを作成します。

廃止。 代わりに CommandStep を使用してください。 例については、「 CommandStep を使用してパイプラインで分散トレーニングを実行する方法」を参照してください。

ParallelRunConfig

ParallelRunStep オブジェクトの構成を定義します。

ParallelRunStep の使用例については、ノートブックの https://aka.ms/batch-inference-notebooksを参照してください。

トラブルシューティング ガイドについては、 https://aka.ms/prstsgを参照してください。 その他の参照を見つけることができます。

config オブジェクトを初期化します。

ParallelRunStep

大量のデータを非同期的かつ並列に処理する Azure Machine Learning パイプライン ステップを作成します。

ParallelRunStep の使用例については、ノートブックの https://aka.ms/batch-inference-notebooksを参照してください。

トラブルシューティング ガイドについては、 https://aka.ms/prstsgを参照してください。 その他の参照を見つけることができます。

大量のデータを非同期的かつ並列に処理する Azure ML パイプライン ステップを作成します。

ParallelRunStep の使用例については、ノートブック リンクの https://aka.ms/batch-inference-notebooksを参照してください。

PythonScriptStep

Python スクリプトを実行する Azure ML パイプライン ステップを作成します。

PythonScriptStep の使用例については、ノートブックの https://aka.ms/pl-get-startedを参照してください。

Python スクリプトを実行する Azure ML パイプライン ステップを作成します。

RScriptStep

これは試験的なクラスであり、いつでも変更される可能性があります。 詳細については、https://aka.ms/azuremlexperimental を参照してください。

R スクリプトを実行する Azure ML パイプライン ステップを作成します。

R スクリプトを実行する Azure ML パイプライン ステップを作成します。

廃止。 代わりに CommandStep を使用してください。 例については、「 CommandStep を使用してパイプラインで R スクリプトを実行する方法」を参照してください。

SynapseSparkStep

これは試験的なクラスであり、いつでも変更される可能性があります。 詳細については、https://aka.ms/azuremlexperimental を参照してください。

Python スクリプトを送信して実行する Azure ML Synapse ステップを作成します。

Synapse Spark プールで Spark ジョブを実行する Azure ML パイプライン ステップを作成します。