다음을 통해 공유


core 패키지

구성 가능한 기계 학습 워크플로인 Azure Machine Learning 파이프라인에 대한 핵심 기능을 포함합니다.

Azure Machine Learning 파이프라인을 사용하면 기계 학습 시나리오에 대한 템플릿으로 사용할 수 있는 재사용 가능한 기계 학습 워크플로를 만들 수 있습니다. 이 패키지에는 Azure ML 파이프라인을 사용하기 위한 핵심 기능이 포함되어 있으며 일반적으로 패키지의 클래스 steps 와 함께 사용됩니다.

기계 학습 파이프라인은 시퀀스 및 병렬 처리하거나 단계 간에 명시적 종속성을 사용하여 만들 수 있는 개체 컬렉션 PipelineStep 으로 표시됩니다. 파이프라인 단계는 실행할 워크플로를 Pipeline 나타내는 개체를 정의하는 데 사용됩니다. Azure ML SDK가 설치된 Jupyter Notebook 또는 다른 IDE에서 파이프라인을 만들고 작업할 수 있습니다.

Azure ML 파이프라인을 사용하면 인프라가 아닌 기계 학습에 집중할 수 있습니다. 파이프라인 빌드를 시작하려면 다음을 참조하세요 https://aka.ms/pl-first-pipeline.

Machine Learning 파이프라인의 이점 및 Azure에서 제공하는 다른 파이프라인과 관련된 방법에 대한 자세한 내용은 Azure Machine Learning 서비스의 ML 파이프라인이란?을 참조하세요.

모듈

builder

Azure Machine Learning 파이프라인을 빌드하기 위한 클래스를 정의합니다.

파이프라인 그래프는 파이프라인 단계(PipelineStep), 각 단계에서 생성 또는 사용되는 선택적 파이프라인 데이터(PipelineData) 및 선택적 단계 실행 시퀀스(StepSequence)로 구성됩니다.

graph

Azure Machine Learning 파이프라인 그래프를 생성하기 위한 클래스를 정의합니다.

Azure ML 파이프라인 그래프는 개체( 및 파생 클래스) 및 개체를 사용할 Pipeline 때 만들어집니다PipelineStep.PipelineDataPipelineData 일반적인 사용 사례에서는 이 모듈의 클래스를 직접 사용할 필요가 없습니다.

파이프라인 실행 그래프는 데이터 원본 또는 단계와 같은 기본 단위를 나타내는 모듈 노드로 구성됩니다. 노드에는 입력 포트와 출력 포트 및 연결된 매개 변수가 있을 수 있습니다. 에지는 그래프에서 두 노드 포트 간의 관계를 정의합니다.

module

Azure Machine Learning 파이프라인의 재사용 가능한 계산 단위를 만들고 관리하기 위한 클래스를 포함합니다.

모듈을 사용하면 입력, 출력 및 매개 변수 및 환경 구성을 사용하여 작동할 수 있는 계산 단위 Pipeline를 만들 수 있습니다. 모듈의 버전을 지정하고 하나의 파이프라인에서 사용되는 (및 파생 클래스)와는 다른 PipelineStep Azure Machine Learning 파이프라인에서 사용할 수 있습니다.

모듈은 여러 파이프라인에서 재사용되도록 설계되었으며 다양한 사용 사례에 대해 특정 계산 논리를 조정하도록 발전할 수 있습니다. 파이프라인의 단계를 빠른 반복으로 사용하여 알고리즘을 개선할 수 있으며, 목표가 달성되면 알고리즘은 일반적으로 다시 사용할 수 있도록 모듈로 게시됩니다.

module_step_base

의 버전을 Module사용하여 파이프라인에 단계를 추가하는 기능을 포함합니다.

pipeline

재사용 가능한 Azure Machine Learning 워크플로를 만들기 위한 클래스를 정의합니다.

pipeline_draft

변경 가능한 파이프라인을 관리하기 위한 클래스를 정의합니다.

pipeline_endpoint

버전 관리 및 엔드포인트를 포함하여 파이프라인을 관리하기 위한 클래스를 정의합니다.

pipeline_output_dataset

중간 출력을 Azure Machine Learning 데이터 세트로 승격하는 기능을 포함합니다.

파이프라인의 중간 데이터(출력)는 기본적으로 Azure Machine Learning 데이터 세트가 되지 않습니다. 중간 데이터를 Azure Machine Learning 데이터 세트로 승격하려면 PipelineData 클래스의 메서드를 호출 as_dataset 하여 개체를 PipelineOutputFileDataset 반환합니다. PipelineOutputFileDataset 개체에서 개체를 PipelineOutputTabularDataset 만들 수 있습니다.

run

상태를 확인하고 실행 세부 정보를 검색하기 위한 클래스를 포함하여 제출된 파이프라인에 대한 클래스를 정의합니다.

schedule

Azure Machine Learning Pipelines 제출을 예약하기 위한 클래스를 정의합니다.

클래스

InputPortBinding

소스에서 파이프라인 단계의 입력으로 바인딩을 정의합니다.

InputPortBinding은 단계에 대한 입력으로 사용할 수 있습니다. 소스는 , , PipelineDataPortDataReferenceDataReference또는 PipelineDataset.일 수 있습니다.OutputPortBinding

InputPortBinding은 바인딩 개체의 이름과 달라야 하는 경우(예: 입력/출력 이름이 중복되지 않도록 하거나 단계 스크립트에 특정 이름을 포함하기 위해 입력이 필요하기 때문에) 단계 입력의 이름을 지정하는 데 유용합니다. 입력에 대한 PythonScriptStep bind_mode 지정하는 데 사용할 수도 있습니다.

InputPortBinding을 초기화합니다.

Module

Azure Machine Learning 파이프라인에 사용되는 계산 단위를 나타냅니다.

모듈은 컴퓨팅 대상에서 실행되는 파일의 컬렉션 및 인터페이스에 대한 설명입니다. 파일 컬렉션은 스크립트, 이진 파일 또는 컴퓨팅 대상에서 실행하는 데 필요한 다른 파일일 수 있습니다. 모듈 인터페이스는 입력, 출력 및 매개 변수 정의를 설명합니다. 특정 값이나 데이터에 바인딩하지 않습니다. 모듈에는 모듈에 대해 정의된 파일 컬렉션을 캡처하는 스냅샷이 연결되어 있습니다.

모듈을 초기화합니다.

ModuleVersion

내의 실제 계산 단위를 나타냅니다 Module.

이 클래스를 직접 사용하면 안 됩니다. 대신 클래스의 게시 메서드 Module 중 하나를 사용합니다.

ModuleVersion을 초기화합니다.

ModuleVersionDescriptor

의 버전 및 ID를 정의합니다 ModuleVersion.

ModuleVersionDescriptor를 초기화합니다.

OutputPortBinding

파이프라인 단계의 명명된 출력을 정의합니다.

OutputPortBinding을 사용하여 한 단계에서 생성할 데이터의 형식과 데이터 생성 방법을 지정할 수 있습니다. 단계 출력이 다른 단계의 필수 입력임을 지정하는 데 사용할 InputPortBinding 수 있습니다.

OutputPortBinding을 초기화합니다.

Pipeline

재사용 가능한 Azure Machine Learning 워크플로로 실행할 수 있는 단계의 컬렉션을 나타냅니다.

파이프라인을 사용하여 다양한 기계 학습 단계를 함께 연결하는 워크플로를 만들고 관리합니다. 데이터 준비 및 모델 학습과 같은 각 기계 학습 단계는 파이프라인에서 하나 이상의 단계로 구성될 수 있습니다.

파이프라인을 사용하는 이유와 시기에 대한 개요는 다음을 참조하세요 https://aka.ms/pl-concept.

파이프라인 생성에 대한 개요는 다음을 참조하세요 https://aka.ms/pl-first-pipeline.

파이프라인을 초기화합니다.

PipelineData

Azure Machine Learning 파이프라인의 중간 데이터를 나타냅니다.

파이프라인에 사용되는 데이터는 한 단계에서 생성되고 PipelineData 개체를 한 단계의 출력으로 제공하고 하나 이상의 후속 단계를 입력하여 다른 단계에서 사용할 수 있습니다.

파이프라인 데이터를 사용하는 경우 사용된 디렉터리가 있는지 확인하세요.

디렉터리가 존재하는지 확인하는 Python 예제입니다. 한 파이프라인 단계에서 output_folder 출력 포트가 있다고 가정하고 이 폴더의 상대 경로에 일부 데이터를 쓰려고 합니다.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData는 데이터 액세스 및 배달에 더 이상 권장되지 않는 DataReference 기본을 사용합니다. 대신 OutputFileDatasetConfig 를 사용하세요. 여기에서 샘플을 찾을 수 있습니다. OutputFileDatasetConfig를 사용하는 파이프라인.

PipelineData를 초기화합니다.

PipelineDataset

데이터 세트 및 파이프라인의 어댑터 역할을 합니다.

비고

이 클래스는 더 이상 사용되지 않습니다. 파이프라인에서 데이터 세트를 사용하는 방법을 알아보려면 https://aka.ms/pipeline-with-dataset를 참조하세요.

내부 클래스입니다. 이 클래스를 직접 만들지 말고 Dataset 또는 OutputDatasetConfig 클래스에서 as_* 인스턴스 메서드를 호출해야 합니다.

데이터 세트 및 파이프라인의 어댑터 역할을 합니다.

내부 클래스입니다. 이 클래스를 직접 만들지 말고 Dataset 또는 OutputDatasetConfig 클래스에서 as_* 인스턴스 메서드를 호출해야 합니다.

PipelineDraft

실행을 제출하고 게시된 파이프라인을 만드는 데 사용할 수 있는 변경 가능한 파이프라인을 나타냅니다.

PipelineDrafts를 사용하여 파이프라인에서 반복합니다. PipelineDrafts를 처음부터 만들거나, 다른 PipelineDraft 또는 기존 파이프라인을 PipelinePublishedPipelinePipelineRun만들 수 있습니다.

PipelineDraft를 초기화합니다.

PipelineEndpoint

Pipeline 고유한 엔드포인트 URL에서 트리거할 수 있는 워크플로를 나타냅니다.

PipelineEndpoints를 사용하여 동일한 엔드포인트를 PublishedPipeline 유지하면서 새 버전을 만들 수 있습니다. PipelineEndpoints는 작업 영역 내에서 고유하게 이름이 지정됩니다.

PipelineEndpoint 개체의 엔드포인트 특성을 사용하여 REST 호출을 사용하여 외부 애플리케이션에서 새 파이프라인 실행을 트리거할 수 있습니다. REST 엔드포인트를 호출할 때 인증하는 방법에 대한 자세한 내용은 다음을 참조하세요 https://aka.ms/pl-restep-auth.

기계 학습 파이프라인을 만들고 실행하는 방법에 대한 자세한 내용은 다음을 참조하세요 https://aka.ms/pl-first-pipeline.

PipelineEndpoint를 초기화합니다.

PipelineParameter

파이프라인 실행에서 매개 변수를 정의합니다.

PipelineParameters를 사용하여 나중에 다양한 매개 변수 값으로 다시 제출할 수 있는 다양한 파이프라인을 생성합니다.

파이프라인 매개 변수를 초기화합니다.

PipelineRun

의 실행을 Pipeline나타냅니다.

이 클래스는 파이프라인 실행이 제출되면 실행 세부 정보를 관리, 확인 및 검색하는 데 사용할 수 있습니다. 파이프라인 실행에서 get_steps 만든 개체를 검색하는 데 사용합니다StepRun. 다른 용도로는 파이프라인 실행과 연결된 개체 검색 Graph , 파이프라인 실행 상태 가져오기, 실행 완료 대기 등이 있습니다.

파이프라인 실행을 초기화합니다.

PipelineStep

Azure Machine Learning 파이프라인의 실행 단계를 나타냅니다.

파이프라인은 파이프라인의 고유한 계산 단위인 여러 파이프라인 단계에서 생성됩니다. 각 단계는 독립적으로 실행되고 격리된 컴퓨팅 리소스를 사용할 수 있습니다. 각 단계에는 일반적으로 고유한 명명된 입력, 출력 및 매개 변수가 있습니다.

PipelineStep 클래스는 일반적인 시나리오를 위해 설계된 다른 기본 제공 단계 클래스(예: PythonScriptStep, DataTransferStepHyperDriveStep)를 상속하는 기본 클래스입니다.

Pipelines 및 PipelineSteps의 관계에 대한 개요는 ML 파이프라인이란?을 참조하세요.

PipelineStep을 초기화합니다.

PortDataReference

완료된 StepRun의 출력과 연결된 데이터를 모델화합니다.

PortDataReference 개체를 사용하여 에 의해 StepRun생성된 출력 데이터를 다운로드할 수 있습니다. 이후 파이프라인에서 단계 입력으로 사용할 수도 있습니다.

PortDataReference를 초기화합니다.

PublishedPipeline

생성한 Python 코드 없이 제출할 파이프라인을 나타냅니다.

또한 PublishedPipeline을 사용하여 다른 Pipeline 값과 입력을 PipelineParameter 사용하여 다시 제출할 수 있습니다.

PublishedPipeline을 초기화합니다.

:p aram 엔드포인트 이 파이프라인에 대한 파이프라인 실행을 제출할 REST 엔드포인트 URL입니다. :type 엔드포인트: str :p aram total_run_steps: 이 파이프라인 :type total_run_steps: int :p aram 작업 영역: 게시된 파이프라인의 작업 영역의 단계 수입니다. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: PipelineRun에서 다른 단계를 계속 실행할지 여부

단계가 실패하면 기본값은 false입니다.

Schedule

파이프라인을 제출할 일정을 정의합니다.

파이프라인이 게시되면 일정을 사용하여 지정된 간격으로 또는 Blob Storage 위치에 대한 변경 내용이 검색될 때 파이프라인을 제출할 수 있습니다.

일정을 초기화합니다.

ScheduleRecurrence

파이프라인 Schedule의 빈도, 간격 및 시작 시간을 정의합니다.

ScheduleRecurrence를 사용하면 되풀이에 대한 표준 시간대와 시간 또는 분 또는 요일을 지정할 수도 있습니다.

일정 되풀이를 초기화합니다.

또한 되풀이에 대한 표준 시간대와 시간 또는 분 또는 요일을 지정할 수 있습니다.

StepRun

의 단계 실행입니다 Pipeline.

이 클래스는 부모 파이프라인 실행이 제출되고 파이프라인이 단계 실행을 제출한 후 실행 세부 정보를 관리, 확인 및 검색하는 데 사용할 수 있습니다.

StepRun을 초기화합니다.

StepRunOutput

파이프라인에서 만든 출력을 StepRun 나타냅니다.

StepRunOutput을 사용하여 단계에서 만든 개체에 PortDataReference 액세스할 수 있습니다.

StepRunOutput을 초기화합니다.

StepSequence

단계 Pipeline 목록과 실행 순서를 나타냅니다.

파이프라인을 초기화할 때 StepSequence를 사용하여 특정 순서로 실행하는 단계를 포함하는 워크플로를 만듭니다.

StepSequence를 초기화합니다.

TrainingOutput

파이프라인에서 사용할 특정 PipelineSteps의 특수 출력을 정의합니다.

TrainingOutput을 사용하면 자동화된 기계 학습 메트릭 또는 모델을 Azure Machine Learning 파이프라인의 다른 단계에서 사용할 단계 출력으로 사용할 수 있습니다. 와 함께 AutoMLStep 사용할 수 있습니다.HyperDriveStep

TrainingOutput을 초기화합니다.

param model_file: 출력에 포함할 특정 모델 파일입니다. 전용입니다 HyperDriveStep .

열거형

TimeZone

되풀이에 유효한 표준 시간대를 열거합니다 Schedule.