다음을 통해 공유


TensorFlow 클래스

TensorFlow 실험에서 학습하기 위한 추정기를 나타냅니다.

되지 않는. 사용자 고유의 ScriptRunConfig 정의된 환경 또는 Azure ML TensorFlow 큐레이팅된 환경 중 하나에서 개체를 사용합니다. ScriptRunConfig를 사용하여 TensorFlow 실험 실행을 구성하는 방법에 대한 소개는 Azure Machine Learning을 사용하여 대규모 TensorFlow 모델 학습을 참조하세요.

지원되는 버전: 1.10, 1.12, 1.13, 2.0, 2.1, 2.2

TensorFlow 추정기를 초기화합니다.

Docker 실행 참조입니다. :type shm_size: str :p aram resume_from: 실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: 실행에 허용되는 최대 시간입니다. Azure ML은 자동으로 시도합니다.

이 값보다 오래 걸리는 경우 실행을 취소합니다.

생성자

TensorFlow(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, worker_count=1, parameter_server_count=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

매개 변수

Name Description
source_directory
필수
str

실험 구성 파일이 포함된 로컬 디렉터리입니다.

compute_target
필수

학습이 수행되는 컴퓨팅 대상입니다. 개체 또는 문자열 "local"일 수 있습니다.

vm_size
필수
str

학습을 위해 만들 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기입니다.

vm_priority
필수
str

학습을 위해 만들 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 'dedicated'가 사용됩니다.

지원되는 값:'dedicated' 및 'lowpriority'.

이는 입력에 vm_size param 지정된 경우에만 적용됩니다.

entry_script
필수
str

학습 스크립트를 포함하는 파일의 상대 경로입니다.

script_params
필수

에 지정된 학습 스크립트에 전달할 명령줄 인수의 사전입니다 entry_script.

node_count
필수
int

학습에 사용되는 컴퓨팅 대상의 노드 수입니다. AmlCompute 대상만 분산 학습(node_count>1)에 대해 지원됩니다.

process_count_per_node
필수
int

MPI를 사용하는 경우 노드당 프로세스 수입니다.

worker_count
필수
int

분산 학습에 매개 변수 서버를 사용하는 경우 작업자 노드 수입니다.

되지 않는. 매개 변수의 일부로 지정합니다 distributed_training .

parameter_server_count
필수
int

분산 학습에 매개 변수 서버를 사용하는 경우 매개 변수 서버 노드의 수입니다.

distributed_backend
필수
str

분산 학습을 위한 통신 백 엔드입니다.

되지 않는. distributed_training 매개 변수를 사용합니다.

지원되는 값: 'mpi' 및 'ps'. 'mpi'는 MPI/Horovod를 나타내고 'ps'는 매개 변수 서버를 나타냅니다.

이 매개 변수는 , node_count또는 process_count_per_nodeworker_countparameter_server_count 1일 >때 필요합니다. 'ps'의 경우 합계 worker_countparameter_server_count 가 *(노드당 CPU 또는 GPU 수)보다 작거나 같 node_count 아야 합니다.

== 1 및 node_count == 1이면 process_count_per_node 백 엔드가 명시적으로 설정되지 않는 한 백 엔드가 사용되지 않습니다. AmlCompute 대상만 분산 학습에 지원됩니다.

distributed_training
필수

분산 학습 작업을 실행하기 위한 매개 변수입니다.

매개 변수 서버 백 엔드를 사용하여 분산 작업을 실행하려면 개체를 ParameterServer 사용하여 지정 worker_count 하고 parameter_server_count. 및 worker_count 매개 변수의 parameter_server_count 합계는 *(노드당 CPU 또는 GPU 수)보다 작거나 같 node_count 아야 합니다.

MPI 백 엔드를 사용하여 분산 작업을 실행하려면 개체를 Mpi 사용하여 지정 process_count_per_node합니다.

use_gpu
필수

실험을 실행하는 환경에서 GPU를 지원할지 여부를 지정합니다. true이면 GPU 기반 기본 Docker 이미지가 환경에서 사용됩니다. false이면 CPU 기반 이미지가 사용됩니다. 기본 Docker 이미지(CPU 또는 GPU)는 매개 변수가 custom_docker_image 설정되지 않은 경우에만 사용됩니다. 이 설정은 Docker 사용 컴퓨팅 대상에서만 사용됩니다.

use_docker
필수

실험을 실행할 환경이 Docker 기반 환경인지 여부를 지정합니다.

custom_docker_base_image
필수
str

학습에 사용할 이미지를 빌드할 Docker 이미지의 이름입니다.

되지 않는. custom_docker_image 매개 변수를 사용합니다.

설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다.

custom_docker_image
필수
str

학습에 사용할 이미지를 빌드할 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다.

image_registry_details
필수

Docker 이미지 레지스트리의 세부 정보입니다.

user_managed
필수

Azure ML이 기존 Python 환경을 다시 사용할지 여부를 지정합니다. false이면 Azure ML은 conda 종속성 사양에 따라 Python 환경을 만듭니다.

conda_packages
필수

실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다.

pip_packages
필수

실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다.

conda_dependencies_file_path
필수
str

conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 지정된 경우 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. 되지 않는. conda_dependencies_file 매개 변수를 사용합니다.

pip_requirements_file_path
필수
str

pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다. 매개 변수와 pip_packages 함께 제공할 수 있습니다. 되지 않는. pip_requirements_file 매개 변수를 사용합니다.

conda_dependencies_file
필수
str

conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 지정된 경우 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.

pip_requirements_file
필수
str

pip 요구 사항 텍스트 파일의 상대 경로를 나타내는 문자열입니다. 매개 변수와 pip_packages 함께 제공할 수 있습니다.

environment_variables
필수

환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다.

environment_definition
필수

실험에 대한 환경 정의입니다. PythonSection, DockerSection 및 환경 변수가 포함됩니다. 다른 매개 변수를 통해 추정기 생성에 직접 노출되지 않는 모든 환경 옵션은 이 매개 변수를 사용하여 설정할 수 있습니다. 이 매개 변수를 지정하면 , use_gpucustom_docker_image또는 conda_packages. 같은 다른 환경 관련 매개 변수pip_packages보다 우선합니다. 이러한 잘못된 조합에서 오류가 보고됩니다.

inputs
필수

입력으로 사용할 개체 목록 DataReference 입니다 DatasetConsumptionConfig .

source_directory_data_store
필수

프로젝트 공유에 대한 지원 데이터 저장소입니다.

shm_size
필수
str

Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본 azureml.core.environment._DEFAULT_SHM_SIZE 사용됩니다. 자세한 내용은 Docker 실행 참조를 참조하세요.

resume_from
필수

실험을 다시 시작할 검사점 또는 모델 파일이 포함된 데이터 경로입니다.

max_run_duration_seconds
필수
int

실행에 허용되는 최대 시간입니다. Azure ML은 이 값보다 오래 걸리는 경우 실행을 자동으로 취소하려고 시도합니다.

framework_version
필수
str

학습 코드를 실행하는 데 사용할 TensorFlow 버전입니다. 버전이 제공되지 않으면 예측 도구는 기본적으로 Azure ML에서 지원하는 최신 버전으로 설정됩니다. 목록을 반환하여 현재 Azure ML SDK에서 지원되는 모든 버전의 목록을 가져오는 데 사용합니다 TensorFlow.get_supported_versions() .

source_directory
필수
str

실험 구성 파일이 포함된 로컬 디렉터리입니다.

compute_target
필수

학습이 수행되는 컴퓨팅 대상입니다. 개체 또는 문자열 "local"일 수 있습니다.

vm_size
필수
str

학습을 위해 만들 컴퓨팅 대상의 VM 크기입니다. 지원되는 값: 모든 Azure VM 크기입니다.

vm_priority
필수
str

학습을 위해 만들 컴퓨팅 대상의 VM 우선 순위입니다. 지정하지 않으면 'dedicated'가 사용됩니다.

지원되는 값:'dedicated' 및 'lowpriority'.

이는 입력에 vm_size param 지정된 경우에만 적용됩니다.

entry_script
필수
str

학습 스크립트를 포함하는 파일의 상대 경로입니다.

script_params
필수

에 지정된 tne 학습 스크립트에 전달할 명령줄 인수의 사전입니다 entry_script.

node_count
필수
int

학습에 사용되는 컴퓨팅 대상의 노드 수입니다. AmlCompute 대상만 분산 학습(node_count>1)에 대해 지원됩니다.

process_count_per_node
필수
int

MPI를 사용하는 경우 노드당 프로세스 수입니다.

worker_count
필수
int

매개 변수 서버를 사용하는 경우 작업자 노드의 수입니다.

되지 않는. 매개 변수의 일부로 지정합니다 distributed_training .

parameter_server_count
필수
int

매개 변수 서버를 사용하는 경우 매개 변수 서버 노드의 수입니다.

distributed_backend
필수
str

분산 학습을 위한 통신 백 엔드입니다.

되지 않는. distributed_training 매개 변수를 사용합니다.

지원되는 값: 'mpi' 및 'ps'. 'mpi'는 MPI/Horovod를 나타내고 'ps'는 매개 변수 서버를 나타냅니다.

이 매개 변수는 , node_count또는 process_count_per_nodeworker_countparameter_server_count 1일 >때 필요합니다. 'ps'의 경우 합계 worker_countparameter_server_count 가 *(노드당 CPU 또는 GPU 수)보다 작거나 같 node_count 아야 합니다.

== 1 및 node_count == 1이면 process_count_per_node 백 엔드가 명시적으로 설정되지 않는 한 백 엔드가 사용되지 않습니다. AmlCompute 대상만 분산 학습에 지원됩니다. 는 분산 학습에 대해 지원됩니다.

distributed_training
필수

분산 학습 작업을 실행하기 위한 매개 변수입니다.

매개 변수 서버 백 엔드를 사용하여 분산 작업을 실행하려면 개체를 사용하여 ParameterServer 지정 worker_count 하고 parameter_server_count. 및 worker_count 매개 변수의 parameter_server_count 합계는 *(노드당 CPU 또는 GPU 수)보다 작거나 같 node_count 아야 합니다.

MPI 백 엔드를 사용하여 분산 작업을 실행하려면 개체를 사용하여 Mpi 지정 process_count_per_node합니다.

use_gpu
필수

실험을 실행하는 환경에서 GPU를 지원할지 여부를 지정합니다. true이면 GPU 기반 기본 Docker 이미지가 환경에서 사용됩니다. false이면 CPU 기반 이미지가 사용됩니다. 기본 Docker 이미지(CPU 또는 GPU)는 매개 변수가 설정되지 않은 경우에만 custom_docker_image 사용됩니다. 이 설정은 Docker 사용 컴퓨팅 대상에서만 사용됩니다.

use_docker
필수

실험을 실행할 환경이 Docker 기반 환경인지 여부를 지정합니다.

custom_docker_base_image
필수
str

학습에 사용할 이미지를 빌드할 Docker 이미지의 이름입니다.

되지 않는. custom_docker_image 매개 변수를 사용합니다.

설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다.

custom_docker_image
필수
str

학습에 사용할 이미지를 빌드할 Docker 이미지의 이름입니다. 설정하지 않으면 기본 CPU 기반 이미지가 기본 이미지로 사용됩니다.

image_registry_details
필수

Docker 이미지 레지스트리의 세부 정보입니다.

user_managed
필수

Azure ML이 기존 Python 환경을 다시 사용할지 여부를 지정합니다. false이면 Azure ML은 conda 종속성 사양에 따라 Python 환경을 만듭니다.

conda_packages
필수

실험을 위해 Python 환경에 추가할 conda 패키지를 나타내는 문자열 목록입니다.

pip_packages
필수

실험을 위해 Python 환경에 추가할 pip 패키지를 나타내는 문자열 목록입니다.

conda_dependencies_file_path
필수
str

conda 종속성 yaml 파일의 상대 경로입니다. 지정된 경우 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다. 되지 않는. conda_dependencies_file 매개 변수를 사용합니다.

pip_requirements_file_path
필수
str

pip 요구 사항 텍스트 파일의 상대 경로입니다. 매개 변수와 pip_packages 함께 제공할 수 있습니다. 되지 않는. pip_requirements_file 매개 변수를 사용합니다.

environment_variables
필수

환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다.

conda_dependencies_file
필수
str

conda 종속성 yaml 파일의 상대 경로를 나타내는 문자열입니다. 지정된 경우 Azure ML은 프레임워크 관련 패키지를 설치하지 않습니다.

pip_requirements_file
필수
str

pip 요구 사항 텍스트 파일의 상대 경로입니다. 매개 변수와 pip_packages 함께 제공할 수 있습니다.

environment_variables
필수

환경 변수 이름 및 값의 사전입니다. 이러한 환경 변수는 사용자 스크립트가 실행되는 프로세스에서 설정됩니다.

environment_definition
필수

실험에 대한 환경 정의입니다. PythonSection, DockerSection 및 환경 변수가 포함됩니다. 다른 매개 변수를 통해 추정기 생성에 직접 노출되지 않는 모든 환경 옵션은 이 매개 변수를 사용하여 설정할 수 있습니다. 이 매개 변수를 지정하면 , , use_gpu또는 custom_docker_image.와 같은 conda_packagespip_packages다른 환경 관련 매개 변수보다 우선합니다. 이러한 잘못된 조합에서 오류가 보고됩니다.

inputs
필수

azureml.data.data_reference 목록입니다. 입력으로 사용할 DataReference 개체입니다.

source_directory_data_store
필수
str

프로젝트 공유에 대한 지원 데이터 저장소입니다.

shm_size
필수

Docker 컨테이너의 공유 메모리 블록 크기입니다. 설정하지 않으면 기본값은 azureml.core.environment._DEFAULT_SHM_SIZE. 자세한 내용은 참조하세요.

framework_version
필수
str

학습 코드를 실행하는 데 사용할 TensorFlow 버전입니다. 버전이 제공되지 않으면 예측 도구는 기본적으로 Azure ML에서 지원하는 최신 버전으로 설정됩니다. TensorFlow.get_supported_versions()를 사용하여 목록을 반환하여 현재 Azure ML SDK에서 지원되는 모든 버전의 목록을 가져옵니다.

_enable_optimized_mode
필수

더 빠른 환경 준비를 위해 미리 빌드된 프레임워크 이미지를 사용하여 증분 환경 빌드를 사용하도록 설정합니다. 미리 빌드된 프레임워크 이미지는 프레임워크 종속성이 미리 설치된 Azure ML 기본 CPU/GPU 기본 이미지 위에 빌드됩니다.

_disable_validation
필수

제출을 실행하기 전에 스크립트 유효성 검사를 사용하지 않도록 설정합니다. 기본값은 True입니다.

_show_lint_warnings
필수

스크립트 Linting 경고를 표시합니다. 기본값은 False입니다.

_show_package_warnings
필수

패키지 유효성 검사 경고를 표시합니다. 기본값은 False입니다.

설명

학습 작업을 제출할 때 Azure ML은 Docker 컨테이너 내의 conda 환경에서 스크립트를 실행합니다. TensorFlow 컨테이너에는 다음과 같은 종속성이 설치되어 있습니다.

종속성 | TensorFlow 1.10/1.12 | TensorFlow 1.13 | TF 2.0/2.1/2.2 | ———————————— | ——————– | ————— | —————— | Python | 3.6.2 | 3.6.2 | 3.6.2 | CUDA(GPU 이미지에만 해당) | 9.0 | 10.0 | 10.0 | cuDNN(GPU 이미지에만 해당) | 7.6.3 | 7.6.3 | 7.6.3 | NCCL(GPU 이미지만 해당) | 2.4.8 | 2.4.8 | 2.4.8 | azureml-defaults | 최신 | 최신 | 최신 | azureml-dataset-runtime[fuse,pandas] | 최신 | 최신 | 최신 | IntelMpi | 2018.3.222 | 2018.3.222 | —- | OpenMpi | —- | —- | 3.1.2 | horovod | 0.15.2 | 0.16.1 | 0.18.1/0.19.1/0.19.5 | miniconda | 4.5.11 | 4.5.11 | 4.5.11 | tensorflow | 1.10.0/1.12.0 | 1.13.1 | 2.0.0/2.1.0/2.2.0 | git | 2.7.4 | 2.7.4 | 2.7.4 |

v1 Docker 이미지는 Ubuntu 16.04를 확장합니다. v2 Docker 이미지는 Ubuntu 18.04를 확장합니다.

추가 종속성을 설치하려면 해당 또는 pip_packages 매개 변수를 conda_packages 사용할 수 있습니다. 또는 매개 변수를 pip_requirements_fileconda_dependencies_file 지정할 수 있습니다. 또는 고유한 이미지를 빌드하고 매개 변수를 custom_docker_image 추정기 생성자에 전달할 수 있습니다.

TensorFlow 학습에 사용되는 Docker 컨테이너에 대한 자세한 내용은 다음을 참조하세요 https://github.com/Azure/AzureML-Containers.

TensorFlow 클래스는 분산 학습의 두 가지 방법을 지원합니다.

분산 학습에서 TensorFlow를 사용하는 방법에 대한 예제 및 자세한 내용은 Azure Machine Learning을 사용하여 대규모 TensorFlow 모델 학습 및 등록 자습서를 참조하세요.

특성

DEFAULT_VERSION

DEFAULT_VERSION = '1.13'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'TensorFlow'