ModuleStep 클래스
특정 버전의 모듈을 실행하는 Azure Machine Learning 파이프라인 단계를 만듭니다.
Module 개체는 다른 기계 학습 시나리오 및 다른 사용자가 사용할 수 있는 재사용 가능한 계산(예: 스크립트 또는 실행 파일)을 정의합니다. 파이프라인에서 특정 버전의 모듈을 사용하려면 ModuleStep을 만듭니다. ModuleStep은 기존 ModuleVersion을 사용하는 파이프라인의 단계입니다.
ModuleStep을 사용하는 예제는 Notebook https://aka.ms/pl-modulestep을 참조하세요.
특정 버전의 모듈을 실행하는 Azure ML 파이프라인 단계를 만듭니다.
생성자
ModuleStep(module=None, version=None, module_version=None, inputs_map=None, outputs_map=None, compute_target=None, runconfig=None, runconfig_pipeline_params=None, arguments=None, params=None, name=None, _workflow_provider=None)
매개 변수
Name | Description |
---|---|
module
|
단계에서 사용되는 모듈입니다.
Default value: None
|
version
|
단계에서 사용되는 모듈의 버전입니다. Default value: None
|
module_version
|
단계에서 사용되는 모듈의 ModuleVersion입니다.
Default value: None
|
inputs_map
|
dict[str, Union[InputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputAbstractDataset, DatasetConsumptionConfig]]
ModuleVersion의 포트 정의 이름을 단계의 입력에 매핑하는 사전입니다. Default value: None
|
outputs_map
|
dict[str, Union[OutputPortBinding, DataReference, PortDataReference, PipelineData, PipelineOutputAbstractDataset]]
ModuleVersion의 포트 정의 이름을 단계의 출력에 매핑하는 사전입니다. Default value: None
|
compute_target
|
사용할 컴퓨팅 대상입니다. 지정되지 않은 경우 runconfig의 대상이 사용됩니다. 작업 영역에서 컴퓨팅 대상 개체 또는 컴퓨팅 대상의 문자열 이름일 수 있습니다. 필요에 따라 파이프라인을 만들 때 컴퓨팅 대상을 사용할 수 없는 경우 컴퓨팅 대상 개체를 가져오지 않도록 튜플('컴퓨팅 대상 이름', '컴퓨팅 대상 형식')을 지정할 수 있습니다(AmlCompute 형식은 'AmlCompute'이고 RemoteCompute 형식은 'VirtualMachine'). Default value: None
|
runconfig
|
사용할 선택적 RunConfiguration입니다. RunConfiguration을 사용하여 conda 종속성 및 Docker 이미지와 같은 실행에 대한 추가 요구 사항을 지정할 수 있습니다. Default value: None
|
runconfig_pipeline_params
|
각각 runconfig 속성의 이름과 해당 속성의 PipelineParameter가 있는 키-값 쌍을 사용하여 런타임 시 runconfig 속성을 재정의합니다. 지원되는 값: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount' Default value: None
|
arguments
|
Python 스크립트 파일에 대한 명령줄 인수 목록입니다. 인수는 RunConfiguration의 인수를 통해 컴퓨팅 대상에 전달됩니다. 특수 기호와 같은 인수를 처리하는 방법에 대한 자세한 내용은 다음의 인수를 참조하세요. RunConfiguration Default value: None
|
params
|
이름-값 쌍의 사전입니다. Default value: None
|
name
|
단계의 이름입니다. Default value: None
|
_workflow_provider
|
<xref:azureml.pipeline.core._aeva_provider._AevaWorkflowProvider>
(내부용으로만 사용) 워크플로 공급자입니다. Default value: None
|
module
필수
|
단계에서 사용되는 모듈입니다.
|
version
필수
|
단계에서 사용되는 모듈의 버전입니다. |
module_version
필수
|
단계에서 사용되는 모듈의 ModuleVersion입니다.
|
inputs_map
필수
|
dict[str, Union[InputPortBinding, DataReference, PortDataReference, PipelineData, <xref:azureml.pipeline.core.pipeline_output_dataset.PipelineOutputDataset>, DatasetConsumptionConfig]]
ModuleVersion의 포트 정의 이름을 단계의 입력에 매핑하는 사전입니다. |
outputs_map
필수
|
dict[str, Union[InputPortBinding, DataReference, PortDataReference, PipelineData, <xref:azureml.pipeline.core.pipeline_output_dataset.PipelineOutputDataset>]]
ModuleVersion의 포트 정의 이름을 단계의 출력에 매핑하는 사전입니다. |
compute_target
필수
|
사용할 컴퓨팅 대상입니다. 지정되지 않은 경우 runconfig의 대상이 사용됩니다. 작업 영역에서 컴퓨팅 대상 개체 또는 컴퓨팅 대상의 문자열 이름일 수 있습니다. 필요에 따라 파이프라인을 만들 때 컴퓨팅 대상을 사용할 수 없는 경우 컴퓨팅 대상 개체를 가져오지 않도록 튜플('컴퓨팅 대상 이름', '컴퓨팅 대상 형식')을 지정할 수 있습니다(AmlCompute 형식은 'AmlCompute'이고 RemoteCompute 형식은 'VirtualMachine'). |
runconfig
필수
|
사용할 선택적 RunConfiguration입니다. RunConfiguration을 사용하여 conda 종속성 및 Docker 이미지와 같은 실행에 대한 추가 요구 사항을 지정할 수 있습니다. |
runconfig_pipeline_params
필수
|
각각 runconfig 속성의 이름과 해당 속성의 PipelineParameter가 있는 키-값 쌍을 사용하여 런타임 시 runconfig 속성을 재정의합니다. 지원되는 값: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount' |
arguments
필수
|
Python 스크립트 파일에 대한 명령줄 인수 목록입니다. 인수는 RunConfiguration의 인수를 통해 컴퓨팅 대상에 전달됩니다. 특수 기호와 같은 인수를 처리하는 방법에 대한 자세한 내용은 다음의 인수를 참조하세요. RunConfiguration |
params
필수
|
이름-값 쌍의 사전입니다. |
name
필수
|
단계의 이름입니다. |
_wokflow_provider
필수
|
(내부용으로만 사용) 워크플로 공급자입니다. |
설명
A Module 는 Azure Machine Learning 파이프라인의 재사용 가능한 계산 단위를 만들고 관리하는 데 사용됩니다. ModuleStep은 모듈을 사용하는 데 사용되는 Azure Machine Learning의 기본 제공 단계입니다. 사용할 ModuleVersion을 구체적으로 정의하거나 Azure Machine Learning에서 클래스의 Module 설명 섹션에 정의된 확인 프로세스에 따라 사용할 ModuleVersion을 확인하도록 할 수 있습니다. 제출된 파이프라인에서 사용되는 ModuleVersion을 정의하려면 ModuleStep을 만들 때 다음 중 하나를 정의합니다.
ModuleVersion 개체입니다.
Module 개체 및 버전 값입니다.
Module 버전 값이 없는 개체입니다. 이 경우 버전 확인은 제출마다 다를 수 있습니다.
ModuleStep의 입력과 출력 간의 매핑을 ModuleVersion의 입력 및 출력에 정의해야 합니다.
다음 예제에서는 여러 ModuleStep 개체를 사용하여 파이프라인의 일부로 ModuleStep을 만드는 방법을 보여줍니다.
middle_step = ModuleStep(module=module,
inputs_map= middle_step_input_wiring,
outputs_map= middle_step_output_wiring,
runconfig=RunConfiguration(), compute_target=aml_compute,
arguments = ["--file_num1", first_sum, "--file_num2", first_prod,
"--output_sum", middle_sum, "--output_product", middle_prod])
전체 샘플은 다음에서 사용할 수 있습니다. https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-modulestep.ipynb
메서드
create_node |
ModuleStep 단계에서 노드를 만들고 지정된 그래프에 추가합니다. 이 메서드는 직접 사용할 수 없습니다. 이 단계로 파이프라인이 인스턴스화되면 Azure ML은 워크플로를 나타내는 파이프라인 그래프에 단계를 추가할 수 있도록 이 메서드를 통해 필요한 매개 변수를 자동으로 전달합니다. |
create_node
ModuleStep 단계에서 노드를 만들고 지정된 그래프에 추가합니다.
이 메서드는 직접 사용할 수 없습니다. 이 단계로 파이프라인이 인스턴스화되면 Azure ML은 워크플로를 나타내는 파이프라인 그래프에 단계를 추가할 수 있도록 이 메서드를 통해 필요한 매개 변수를 자동으로 전달합니다.
create_node(graph, default_datastore, context)
매개 변수
Name | Description |
---|---|
graph
필수
|
노드를 추가할 그래프 개체입니다. |
default_datastore
필수
|
기본 데이터 저장소입니다. |
context
필수
|
<xref:azureml.pipeline.core._GraphContext>
그래프 컨텍스트입니다. |
반환
형식 | Description |
---|---|
노드 개체입니다. |