core パッケージ
構成可能な機械学習ワークフローである Azure Machine Learning パイプラインのコア機能が含まれています。
Azure Machine Learning パイプラインを使用すると、機械学習シナリオのテンプレートとして使用できる再利用可能な機械学習ワークフローを作成できます。 このパッケージには、Azure ML パイプラインを操作するためのコア機能が含まれており、通常は steps パッケージ内のクラスと共に使用されます。
機械学習パイプラインは、シーケンス化および並列化できる、またはステップ間の明示的な依存関係を使用して作成できる PipelineStep オブジェクトのコレクションによって表されます。 パイプラインステップは、実行するワークフローを表す Pipeline オブジェクトを定義するために使用されます。 Jupyter Notebook または Azure ML SDK がインストールされている他の IDE でパイプラインを作成して操作できます。
Azure ML パイプラインを使用すると、インフラストラクチャではなく機械学習に集中できます。 パイプラインの構築を開始するには、 https://aka.ms/pl-first-pipelineを参照してください。
Machine Learning パイプラインの利点と、それが Azure によって提供される他のパイプラインとどのように関連しているかの詳細については、「Azure Machine Learning Service の ML パイプラインとは」を参照してください。
モジュール
builder |
Azure Machine Learning パイプラインを構築するためのクラスを定義します。 パイプライン グラフは、パイプライン ステップ (PipelineStep)、各ステップで生成または使用されるオプションのパイプライン データ (PipelineData)、およびオプションのステップ実行シーケンス (StepSequence) で構成されます。 |
graph |
Azure Machine Learning パイプライン グラフを構築するためのクラスを定義します。 azure ML パイプライン グラフは、Pipeline (および派生クラス)、PipelineStep、およびPipelineData オブジェクトを使用すると、PipelineData オブジェクト用に作成されます。 一般的なユース ケースでは、このモジュールのクラスを直接使用する必要はありません。 パイプライン実行グラフは、データソースやステップなどの基本単位を表すモジュール ノードで構成されます。 ノードには、入力ポートと出力ポート、および関連するパラメーターを指定できます。 エッジは、グラフ内の 2 つのノード ポート間のリレーションシップを定義します。 |
module |
Azure Machine Learning パイプラインの再利用可能な計算単位を作成および管理するためのクラスが含まれています。 モジュールを使用すると、 Pipelineで計算単位を作成できます。この単位は、入力、出力を持ち、パラメーターと動作する環境構成に依存できます。 1 つのパイプラインで使用される PipelineStep (および派生クラス) とは異なり、モジュールはバージョン管理され、異なる Azure Machine Learning パイプラインで使用できます。 モジュールは複数のパイプラインで再利用されるように設計されており、さまざまなユース ケースに特定の計算ロジックを適応するように進化させることができます。 パイプライン内のステップを高速反復で使用してアルゴリズムを改善できます。目標が達成されると、通常、アルゴリズムは再利用を可能にするモジュールとして公開されます。 |
module_step_base |
Moduleのバージョンを使用してパイプラインにステップを追加する機能が含まれています。 |
pipeline |
再利用可能な Azure Machine Learning ワークフローを作成するためのクラスを定義します。 |
pipeline_draft |
変更可能なパイプラインを管理するためのクラスを定義します。 |
pipeline_endpoint |
バージョン管理やエンドポイントなど、パイプラインを管理するためのクラスを定義します。 |
pipeline_output_dataset |
中間出力を Azure Machine Learning データセットに昇格させる機能が含まれています。 既定では、パイプライン内の中間データ (出力) は Azure Machine Learning データセットになりません。 中間データを Azure Machine Learning データセットに昇格するには、PipelineData クラスで as_dataset メソッドを呼び出して、 PipelineOutputFileDataset オブジェクトを返します。 PipelineOutputFileDataset オブジェクトから、 PipelineOutputTabularDataset オブジェクトを作成できます。 |
run |
状態を確認したり、実行の詳細を取得したりするためのクラスなど、送信されたパイプラインのクラスを定義します。 |
schedule |
Azure Machine Learning Pipelines の送信をスケジュールするためのクラスを定義します。 |
クラス
InputPortBinding |
ソースからパイプライン ステップの入力へのバインドを定義します。 InputPortBinding は、ステップへの入力として使用できます。 ソースには、 PipelineData、 PortDataReference、 DataReference、 PipelineDataset、または OutputPortBindingを指定できます。 InputPortBinding は、ステップ入力の名前がバインド オブジェクトの名前と異なる必要がある場合 (つまり、入力/出力名が重複しないようにするため、またはステップ スクリプトに特定の名前を入力する必要があるため) を指定する場合に便利です。 また、 PythonScriptStep 入力のbind_modeを指定するために使用することもできます。 InputPortBinding を初期化します。 |
Module |
Azure Machine Learning パイプラインで使用される計算単位を表します。 モジュールは、コンピューティング 先で実行されるファイルのコレクションであり、インターフェイスの説明です。 ファイルのコレクションには、スクリプト、バイナリ、またはコンピューティング 先で実行するために必要なその他のファイルを指定できます。 モジュール インターフェイスは、入力、出力、およびパラメーター定義を記述します。 特定の値やデータにはバインドされません。 モジュールにはスナップショットが関連付けられています。このスナップショットは、モジュールに対して定義されているファイルのコレクションをキャプチャします。 モジュールを初期化します。 |
ModuleVersion |
Module内の実際の計算単位を表します。 このクラスを直接使用しないでください。 代わりに、 Module クラスのいずれかの発行メソッドを使用します。 ModuleVersion を初期化します。 |
ModuleVersionDescriptor |
ModuleVersionのバージョンと ID を定義します。 ModuleVersionDescriptor を初期化します。 |
OutputPortBinding |
パイプライン ステップの名前付き出力を定義します。 OutputPortBinding を使用して、ステップによって生成されるデータの種類とデータの生成方法を指定できます。 InputPortBindingと共に使用して、ステップ出力が別のステップの必須入力であることを指定できます。 OutputPortBinding を初期化します。 |
Pipeline |
再利用可能な Azure Machine Learning ワークフローとして実行できるステップのコレクションを表します。 パイプラインを使用して、さまざまな機械学習フェーズを結合するワークフローを作成および管理します。 データ準備やモデル トレーニングなどの各機械学習フェーズは、パイプライン内の 1 つ以上のステップで構成できます。 パイプラインを使用する理由とタイミングの概要については、「 https://aka.ms/pl-concept」を参照してください。 パイプラインの構築の概要については、「 https://aka.ms/pl-first-pipeline」を参照してください。 パイプラインを初期化します。 |
PipelineData |
Azure Machine Learning パイプライン内の中間データを表します。 パイプラインで使用されるデータは、1 つのステップの出力として PipelineData オブジェクトを指定し、1 つ以上の後続のステップの入力を指定することで、あるステップで生成し、別のステップで使用できます。 パイプライン データを使用している場合は、使用されているディレクトリが存在することを確認してください。 ディレクトリが存在することを確認する Python の例。1 つのパイプライン ステップで output_folder という名前の出力ポートがあり、このフォルダー内の相対パスにデータを書き込む必要があるとします。
PipelineData では、データ アクセスと配信に推奨されるアプローチではなくなった基になる DataReference を使用します。代わりに OutputFileDatasetConfig を使用してください。サンプルについては、 OutputFileDatasetConfig を使用したパイプラインを参照してください。 PipelineData を初期化します。 |
PipelineDataset |
データセットとパイプラインのアダプターとして機能します。 注 このクラスは非推奨です。 パイプラインでデータセットを使用する方法については、「 https://aka.ms/pipeline-with-dataset 」を参照してください。 これは内部クラスです。 このクラスを直接作成するのではなく、Dataset クラスまたは OutputDatasetConfig クラスで as_* インスタンス メソッドを呼び出す必要があります。 データセットとパイプラインのアダプターとして機能します。 これは内部クラスです。 このクラスを直接作成するのではなく、Dataset クラスまたは OutputDatasetConfig クラスで as_* インスタンス メソッドを呼び出す必要があります。 |
PipelineDraft |
実行の送信と発行されたパイプラインの作成に使用できる変更可能なパイプラインを表します。 PipelineDrafts を使用してパイプラインを反復処理します。 PipelineDrafts は、最初から、別の PipelineDraft、または既存のパイプライン ( Pipeline、 PublishedPipeline、または PipelineRun) から作成できます。 PipelineDraft を初期化します。 |
PipelineEndpoint |
一意のエンドポイント URL からトリガーできる Pipeline ワークフローを表します。 PipelineEndpoints を使用すると、同じエンドポイントを維持しながら、 PublishedPipeline の新しいバージョンを作成できます。 PipelineEndpoints は、ワークスペース内で一意に名前が付けられます。 PipelineEndpoint オブジェクトのエンドポイント属性を使用すると、REST 呼び出しを使用して外部アプリケーションから新しいパイプライン実行をトリガーできます。 REST エンドポイントを呼び出すときに認証する方法については、 https://aka.ms/pl-restep-authを参照してください。 機械学習パイプラインの作成と実行の詳細については、 https://aka.ms/pl-first-pipelineを参照してください。 PipelineEndpoint を初期化します。 |
PipelineParameter |
パイプラインの実行でパラメーターを定義します。 PipelineParameters を使用して、さまざまなパラメーター値を使用して後で再送信できる汎用性の高いパイプラインを構築します。 パイプライン パラメーターを初期化します。 |
PipelineRun |
Pipelineの実行を表します。 このクラスを使用して、パイプラインの実行が送信されると、状態の管理、確認、実行の詳細の取得を行うことができます。 get_stepsを使用して、パイプライン実行によって作成されたStepRun オブジェクトを取得します。 その他の用途としては、パイプライン実行に関連付けられている Graph オブジェクトの取得、パイプライン実行の状態のフェッチ、実行の完了の待機などがあります。 パイプラインの実行を初期化します。 |
PipelineStep |
Azure Machine Learning パイプラインの実行ステップを表します。 パイプラインは、パイプライン内の個別の計算単位である複数のパイプライン ステップから構築されます。 各ステップは個別に実行でき、分離されたコンピューティング リソースを使用できます。 各ステップには、通常、独自の名前付き入力、出力、およびパラメーターがあります。 PipelineStep クラスは、一般的なシナリオ用に設計された他の組み込みステップ クラス ( PythonScriptStep、 DataTransferStep、 HyperDriveStepなど) を継承する基本クラスです。 パイプラインと PipelineSteps の関係の概要については、「 ML パイプラインとは」を参照してください。 PipelineStep を初期化します。 |
PortDataReference |
完了した StepRun の出力に関連付けられたデータをモデル化します。 PortDataReference オブジェクトを使用して、 StepRunによって生成された出力データをダウンロードできます。 また、将来のパイプラインでステップ入力として使用することもできます。 PortDataReference を初期化します。 |
PublishedPipeline |
パイプラインを構築した Python コードなしで送信されるパイプラインを表します。 さらに、PublishedPipeline を使用して、異なるPipeline値と入力を持つPipelineParameterを再送信できます。 PublishedPipeline を初期化します。 :p aram エンドポイント: このパイプラインのパイプライン実行を送信する REST エンドポイント URL。 :type endpoint: str :p aram total_run_steps: このパイプラインのステップの数:type total_run_steps: int :p aram workspace: 発行されたパイプラインのワークスペース。 :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: PipelineRun で他のステップの実行を続行するかどうか ステップが失敗した場合、既定値は false です。 |
Schedule |
パイプラインを送信するスケジュールを定義します。 パイプラインが発行されると、スケジュールを使用して、指定された間隔で、または Blob Storage の場所への変更が検出されたときにパイプラインを送信できます。 スケジュールを初期化します。 |
ScheduleRecurrence |
パイプライン Scheduleの頻度、間隔、開始時刻を定義します。 ScheduleRecurrence では、タイム ゾーンと、繰り返しの時間または分または週の日を指定することもできます。 スケジュールの繰り返しを初期化します。 また、タイム ゾーンと、繰り返しの時間または分または週の日を指定することもできます。 |
StepRun |
Pipelineでのステップの実行。 このクラスは、親パイプラインの実行が送信され、パイプラインがステップ実行を送信した後に、実行の詳細を管理、確認、および取得するために使用できます。 StepRun を初期化します。 |
StepRunOutput |
パイプライン内の StepRun によって作成された出力を表します。 StepRunOutput を使用して、ステップによって作成された PortDataReference にアクセスできます。 StepRunOutput を初期化します。 |
StepSequence |
Pipeline内のステップの一覧とその実行順序を表します。 パイプラインを初期化するときに StepSequence を使用して、特定の順序で実行するステップを含むワークフローを作成します。 StepSequence を初期化します。 |
TrainingOutput |
パイプラインで使用する特定の PipelineSteps の特殊な出力を定義します。 TrainingOutput を使用すると、自動化された機械学習メトリックまたはモデルを、Azure Machine Learning パイプラインの別のステップで使用するステップ出力として使用できるようになります。 AutoMLStepまたはHyperDriveStepで使用できます。 TrainingOutput を初期化します。 param model_file: 出力に含める特定のモデル ファイル。 HyperDriveStepのみ。 |
列挙型
TimeZone |
繰り返し Scheduleの有効なタイム ゾーンを列挙します。 |