core パッケージ

構成可能な機械学習ワークフローである Azure Machine Learning パイプラインのコア機能が含まれています。

Azure Machine Learning パイプラインを使用すると、機械学習シナリオのテンプレートとして使用できる再利用可能な機械学習ワークフローを作成できます。このパッケージには、Azure ML パイプラインを操作するためのコア機能が含まれており、通常は steps パッケージ内のクラスと共に使用されます。

機械学習パイプラインは、シーケンス化および並列化できる、またはステップ間の明示的な依存関係を使用して作成できる PipelineStep オブジェクトのコレクションによって表されます。パイプラインステップは、実行するワークフローを表す Pipeline オブジェクトを定義するために使用されます。 Jupyter Notebook または Azure ML SDK がインストールされている他の IDE でパイプラインを作成して操作できます。

Azure ML パイプラインを使用すると、インフラストラクチャではなく機械学習に集中できます。パイプラインの構築を開始するには、 https://aka.ms/pl-first-pipelineを参照してください。

Machine Learning パイプラインの利点と、それが Azure によって提供される他のパイプラインとどのように関連しているかの詳細については、「Azure Machine Learning Service の ML パイプラインとは」を参照してください。

モジュール

builder	Azure Machine Learning パイプラインを構築するためのクラスを定義します。パイプライングラフは、パイプラインステップ (PipelineStep)、各ステップで生成または使用されるオプションのパイプラインデータ (PipelineData)、およびオプションのステップ実行シーケンス (StepSequence) で構成されます。
graph	Azure Machine Learning パイプライングラフを構築するためのクラスを定義します。 azure ML パイプライングラフは、Pipeline (および派生クラス)、PipelineStep、およびPipelineData オブジェクトを使用すると、PipelineData オブジェクト用に作成されます。一般的なユースケースでは、このモジュールのクラスを直接使用する必要はありません。パイプライン実行グラフは、データソースやステップなどの基本単位を表すモジュールノードで構成されます。ノードには、入力ポートと出力ポート、および関連するパラメーターを指定できます。エッジは、グラフ内の 2 つのノードポート間のリレーションシップを定義します。
module	Azure Machine Learning パイプラインの再利用可能な計算単位を作成および管理するためのクラスが含まれています。モジュールを使用すると、 Pipelineで計算単位を作成できます。この単位は、入力、出力を持ち、パラメーターと動作する環境構成に依存できます。 1 つのパイプラインで使用される PipelineStep (および派生クラス) とは異なり、モジュールはバージョン管理され、異なる Azure Machine Learning パイプラインで使用できます。モジュールは複数のパイプラインで再利用されるように設計されており、さまざまなユースケースに特定の計算ロジックを適応するように進化させることができます。パイプライン内のステップを高速反復で使用してアルゴリズムを改善できます。目標が達成されると、通常、アルゴリズムは再利用を可能にするモジュールとして公開されます。
module_step_base	Moduleのバージョンを使用してパイプラインにステップを追加する機能が含まれています。
pipeline	再利用可能な Azure Machine Learning ワークフローを作成するためのクラスを定義します。
pipeline_draft	変更可能なパイプラインを管理するためのクラスを定義します。
pipeline_endpoint	バージョン管理やエンドポイントなど、パイプラインを管理するためのクラスを定義します。
pipeline_output_dataset	中間出力を Azure Machine Learning データセットに昇格させる機能が含まれています。既定では、パイプライン内の中間データ (出力) は Azure Machine Learning データセットになりません。中間データを Azure Machine Learning データセットに昇格するには、PipelineData クラスで as_dataset メソッドを呼び出して、 PipelineOutputFileDataset オブジェクトを返します。 PipelineOutputFileDataset オブジェクトから、 PipelineOutputTabularDataset オブジェクトを作成できます。
run	状態を確認したり、実行の詳細を取得したりするためのクラスなど、送信されたパイプラインのクラスを定義します。
schedule	Azure Machine Learning Pipelines の送信をスケジュールするためのクラスを定義します。

クラス

InputPortBinding	ソースからパイプラインステップの入力へのバインドを定義します。 InputPortBinding は、ステップへの入力として使用できます。ソースには、 PipelineData、 PortDataReference、 DataReference、 PipelineDataset、または OutputPortBindingを指定できます。 InputPortBinding は、ステップ入力の名前がバインドオブジェクトの名前と異なる必要がある場合 (つまり、入力/出力名が重複しないようにするため、またはステップスクリプトに特定の名前を入力する必要があるため) を指定する場合に便利です。また、 PythonScriptStep 入力のbind_modeを指定するために使用することもできます。 InputPortBinding を初期化します。
Module	Azure Machine Learning パイプラインで使用される計算単位を表します。モジュールは、コンピューティング先で実行されるファイルのコレクションであり、インターフェイスの説明です。ファイルのコレクションには、スクリプト、バイナリ、またはコンピューティング先で実行するために必要なその他のファイルを指定できます。モジュールインターフェイスは、入力、出力、およびパラメーター定義を記述します。特定の値やデータにはバインドされません。モジュールにはスナップショットが関連付けられています。このスナップショットは、モジュールに対して定義されているファイルのコレクションをキャプチャします。モジュールを初期化します。
ModuleVersion	Module内の実際の計算単位を表します。このクラスを直接使用しないでください。代わりに、 Module クラスのいずれかの発行メソッドを使用します。 ModuleVersion を初期化します。
ModuleVersionDescriptor	ModuleVersionのバージョンと ID を定義します。 ModuleVersionDescriptor を初期化します。
OutputPortBinding	パイプラインステップの名前付き出力を定義します。 OutputPortBinding を使用して、ステップによって生成されるデータの種類とデータの生成方法を指定できます。 InputPortBindingと共に使用して、ステップ出力が別のステップの必須入力であることを指定できます。 OutputPortBinding を初期化します。
Pipeline	再利用可能な Azure Machine Learning ワークフローとして実行できるステップのコレクションを表します。パイプラインを使用して、さまざまな機械学習フェーズを結合するワークフローを作成および管理します。データ準備やモデルトレーニングなどの各機械学習フェーズは、パイプライン内の 1 つ以上のステップで構成できます。パイプラインを使用する理由とタイミングの概要については、「 https://aka.ms/pl-concept」を参照してください。パイプラインの構築の概要については、「 https://aka.ms/pl-first-pipeline」を参照してください。パイプラインを初期化します。
PipelineData	Azure Machine Learning パイプライン内の中間データを表します。パイプラインで使用されるデータは、1 つのステップの出力として PipelineData オブジェクトを指定し、1 つ以上の後続のステップの入力を指定することで、あるステップで生成し、別のステップで使用できます。パイプラインデータを使用している場合は、使用されているディレクトリが存在することを確認してください。ディレクトリが存在することを確認する Python の例。1 つのパイプラインステップで output_folder という名前の出力ポートがあり、このフォルダー内の相対パスにデータを書き込む必要があるとします。 `import os os.makedirs(args.output_folder, exist_ok=True) f = open(args.output_folder + '/relative_path/file_name', 'w+')` PipelineData では、データアクセスと配信に推奨されるアプローチではなくなった基になる DataReference を使用します。代わりに OutputFileDatasetConfig を使用してください。サンプルについては、 OutputFileDatasetConfig を使用したパイプラインを参照してください。 PipelineData を初期化します。
PipelineDataset	データセットとパイプラインのアダプターとして機能します。注このクラスは非推奨です。パイプラインでデータセットを使用する方法については、「 https://aka.ms/pipeline-with-dataset 」を参照してください。これは内部クラスです。このクラスを直接作成するのではなく、Dataset クラスまたは OutputDatasetConfig クラスで as_* インスタンスメソッドを呼び出す必要があります。データセットとパイプラインのアダプターとして機能します。これは内部クラスです。このクラスを直接作成するのではなく、Dataset クラスまたは OutputDatasetConfig クラスで as_* インスタンスメソッドを呼び出す必要があります。
PipelineDraft	実行の送信と発行されたパイプラインの作成に使用できる変更可能なパイプラインを表します。 PipelineDrafts を使用してパイプラインを反復処理します。 PipelineDrafts は、最初から、別の PipelineDraft、または既存のパイプライン ( Pipeline、 PublishedPipeline、または PipelineRun) から作成できます。 PipelineDraft を初期化します。
PipelineEndpoint	一意のエンドポイント URL からトリガーできる Pipeline ワークフローを表します。 PipelineEndpoints を使用すると、同じエンドポイントを維持しながら、 PublishedPipeline の新しいバージョンを作成できます。 PipelineEndpoints は、ワークスペース内で一意に名前が付けられます。 PipelineEndpoint オブジェクトのエンドポイント属性を使用すると、REST 呼び出しを使用して外部アプリケーションから新しいパイプライン実行をトリガーできます。 REST エンドポイントを呼び出すときに認証する方法については、 https://aka.ms/pl-restep-authを参照してください。機械学習パイプラインの作成と実行の詳細については、 https://aka.ms/pl-first-pipelineを参照してください。 PipelineEndpoint を初期化します。
PipelineParameter	パイプラインの実行でパラメーターを定義します。 PipelineParameters を使用して、さまざまなパラメーター値を使用して後で再送信できる汎用性の高いパイプラインを構築します。パイプラインパラメーターを初期化します。
PipelineRun	Pipelineの実行を表します。このクラスを使用して、パイプラインの実行が送信されると、状態の管理、確認、実行の詳細の取得を行うことができます。 get_stepsを使用して、パイプライン実行によって作成されたStepRun オブジェクトを取得します。その他の用途としては、パイプライン実行に関連付けられている Graph オブジェクトの取得、パイプライン実行の状態のフェッチ、実行の完了の待機などがあります。パイプラインの実行を初期化します。
PipelineStep	Azure Machine Learning パイプラインの実行ステップを表します。パイプラインは、パイプライン内の個別の計算単位である複数のパイプラインステップから構築されます。各ステップは個別に実行でき、分離されたコンピューティングリソースを使用できます。各ステップには、通常、独自の名前付き入力、出力、およびパラメーターがあります。 PipelineStep クラスは、一般的なシナリオ用に設計された他の組み込みステップクラス ( PythonScriptStep、 DataTransferStep、 HyperDriveStepなど) を継承する基本クラスです。パイプラインと PipelineSteps の関係の概要については、「 ML パイプラインとは」を参照してください。 PipelineStep を初期化します。
PortDataReference	完了した StepRun の出力に関連付けられたデータをモデル化します。 PortDataReference オブジェクトを使用して、 StepRunによって生成された出力データをダウンロードできます。また、将来のパイプラインでステップ入力として使用することもできます。 PortDataReference を初期化します。
PublishedPipeline	パイプラインを構築した Python コードなしで送信されるパイプラインを表します。さらに、PublishedPipeline を使用して、異なるPipeline値と入力を持つPipelineParameterを再送信できます。 PublishedPipeline を初期化します。 :p aram エンドポイント: このパイプラインのパイプライン実行を送信する REST エンドポイント URL。 :type endpoint: str :p aram total_run_steps: このパイプラインのステップの数:type total_run_steps: int :p aram workspace: 発行されたパイプラインのワークスペース。 :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: PipelineRun で他のステップの実行を続行するかどうかステップが失敗した場合、既定値は false です。
Schedule	パイプラインを送信するスケジュールを定義します。パイプラインが発行されると、スケジュールを使用して、指定された間隔で、または Blob Storage の場所への変更が検出されたときにパイプラインを送信できます。スケジュールを初期化します。
ScheduleRecurrence	パイプライン Scheduleの頻度、間隔、開始時刻を定義します。 ScheduleRecurrence では、タイムゾーンと、繰り返しの時間または分または週の日を指定することもできます。スケジュールの繰り返しを初期化します。また、タイムゾーンと、繰り返しの時間または分または週の日を指定することもできます。
StepRun	Pipelineでのステップの実行。このクラスは、親パイプラインの実行が送信され、パイプラインがステップ実行を送信した後に、実行の詳細を管理、確認、および取得するために使用できます。 StepRun を初期化します。
StepRunOutput	パイプライン内の StepRun によって作成された出力を表します。 StepRunOutput を使用して、ステップによって作成された PortDataReference にアクセスできます。 StepRunOutput を初期化します。
StepSequence	Pipeline内のステップの一覧とその実行順序を表します。パイプラインを初期化するときに StepSequence を使用して、特定の順序で実行するステップを含むワークフローを作成します。 StepSequence を初期化します。
TrainingOutput	パイプラインで使用する特定の PipelineSteps の特殊な出力を定義します。 TrainingOutput を使用すると、自動化された機械学習メトリックまたはモデルを、Azure Machine Learning パイプラインの別のステップで使用するステップ出力として使用できるようになります。 AutoMLStepまたはHyperDriveStepで使用できます。 TrainingOutput を初期化します。 param model_file: 出力に含める特定のモデルファイル。 HyperDriveStepのみ。

列挙型

TimeZone

繰り返し Scheduleの有効なタイムゾーンを列挙します。

次の方法で共有

core パッケージ

モジュール

クラス

列挙型

フィードバック