다음을 통해 공유


AksServiceDeploymentConfiguration 클래스

Azure Kubernetes Service에 배포된 서비스에 대한 배포 구성 정보를 나타냅니다.

클래스의 메서드를 사용하여 AksServiceDeploymentConfiguration 개체를 deploy_configurationAksWebservice 만듭니다.

AKS 컴퓨팅 대상에 배포하기 위한 구성 개체를 초기화합니다.

생성자

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

매개 변수

Name Description
cpu_cores_limit
필수

이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다.

memory_gb_limit
필수

이 웹 서비스에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다.

autoscale_enabled
필수

이 웹 서비스에 대해 자동 크기 조정을 사용하도록 설정할지 여부를 나타냅니다. None인 경우 num_replicas 기본값은 True입니다.

autoscale_min_replicas
필수
int

이 웹 서비스를 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다.

autoscale_max_replicas
필수
int

이 웹 서비스를 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다.

autoscale_refresh_seconds
필수
int

자동 크기 조정기가 이 웹 서비스의 크기를 조정하려고 시도하는 빈도입니다. 기본값은 1입니다.

autoscale_target_utilization
필수
int

대상 사용률(100점 만점)은 자동 크기 조정기가 이 웹 서비스에 대해 유지 관리하려고 시도해야 합니다. 기본값은 70입니다.

collect_model_data
필수

이 Webservice에 대해 모델 데이터 수집을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

auth_enabled
필수

이 웹 서비스에 대한 인증을 사용하도록 설정할지 여부입니다. 기본값은 True입니다.

cpu_cores
필수

이 웹 서비스에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다.

memory_gb
필수

이 웹 서비스에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다.

enable_app_insights
필수

이 웹 서비스에 Application Insights 로깅을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

scoring_timeout_ms
필수
int

이 Webservice에 대한 점수 매기기 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다.

replica_max_concurrent_requests
필수
int

이 웹 서비스에 대해 허용할 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 구성원이 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요.

max_request_wait_time
필수
int

503 오류를 반환하기 전에 요청이 큐에 유지되는 최대 시간(밀리초)입니다. 기본값은 500입니다.

num_replicas
필수
int

이 웹 서비스에 할당할 컨테이너 수입니다. 기본값이 아닙니다. 이 매개 변수가 설정되지 않은 경우 자동 크기 조정기는 기본적으로 사용하도록 설정됩니다.

primary_key
필수
str

이 웹 서비스에 사용할 기본 인증 키입니다.

secondary_key
필수
str

이 웹 서비스에 사용할 보조 인증 키입니다.

tags
필수

이 Webservice에 제공할 키 값 태그의 사전입니다.

properties
필수

이 웹 서비스를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다.

description
필수
str

이 웹 서비스를 제공하는 설명입니다.

gpu_cores
필수
int

이 웹 서비스에 할당할 GPU 코어 수입니다. 기본값은 0입니다.

period_seconds
필수
int

활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최소값은 1입니다.

initial_delay_seconds
필수
int

활동성 프로브가 시작되기 전에 컨테이너가 시작된 후의 시간(초)입니다. 기본값은 310입니다.

timeout_seconds
필수
int

활동성 프로브 시간이 초과된 후의 시간(초)입니다. 기본값은 2초입니다. 최소값은 1입니다.

success_threshold
필수
int

활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최소값은 1입니다.

failure_threshold
필수
int

Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes는 포기하기 전에 시간을 시도 failureThreshold 합니다. 기본값은 3입니다. 최소값은 1입니다.

namespace
필수
str

이 웹 서비스를 배포할 Kubernetes 네임스페이스: 최대 63개의 소문자 영숫자('a'-'z', '0'-'9') 및 하이픈('-') 문자. 첫 번째 문자와 마지막 문자는 하이픈일 수 없습니다.

token_auth_enabled
필수

이 Webservice에 대해 Azure Active Directory 인증을 사용하도록 설정할지 여부입니다. 이 기능을 사용하도록 설정하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 Webservice에 액세스할 수 있습니다. 기본값은 False입니다.

cpu_cores_limit
필수

이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다.

memory_gb_limit
필수

이 웹 서비스에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다.

blobfuse_enabled

이 웹 서비스에 대한 모델 다운로드에 blobfuse를 사용하도록 설정할지 여부입니다. 기본값: True

Default value: None
autoscale_enabled
필수

이 웹 서비스에 대해 자동 크기 조정을 사용하도록 설정할지 여부를 나타냅니다. None인 경우 num_replicas 기본값은 True입니다.

autoscale_min_replicas
필수
int

이 웹 서비스를 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다.

autoscale_max_replicas
필수
int

이 웹 서비스를 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다.

autoscale_refresh_seconds
필수
int

자동 크기 조정기가 이 웹 서비스의 크기를 조정하려고 시도하는 빈도입니다. 기본값은 1입니다.

autoscale_target_utilization
필수
int

대상 사용률(100점 만점)은 자동 크기 조정기가 이 웹 서비스에 대해 유지 관리하려고 시도해야 합니다. 기본값은 70입니다.

collect_model_data
필수

이 Webservice에 대해 모델 데이터 수집을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

auth_enabled
필수

이 웹 서비스에 대한 인증을 사용하도록 설정할지 여부입니다. 기본값은 True입니다.

cpu_cores
필수

이 웹 서비스에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다.

memory_gb
필수

이 웹 서비스에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다.

enable_app_insights
필수

이 웹 서비스에 Application Insights 로깅을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

scoring_timeout_ms
필수
int

이 Webservice에 대한 점수 매기기 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다.

replica_max_concurrent_requests
필수
int

이 웹 서비스에 대해 허용할 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 구성원이 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요.

max_request_wait_time
필수
int

503 오류를 반환하기 전에 요청이 큐에 유지되는 최대 시간(밀리초)입니다. 기본값은 500입니다.

num_replicas
필수
int

이 웹 서비스에 할당할 컨테이너 수입니다. 기본값이 아닙니다. 이 매개 변수가 설정되지 않은 경우 자동 크기 조정기는 기본적으로 사용하도록 설정됩니다.

primary_key
필수
str

이 웹 서비스에 사용할 기본 인증 키입니다.

secondary_key
필수
str

이 웹 서비스에 사용할 보조 인증 키입니다.

tags
필수

이 Webservice에 제공할 키 값 태그의 사전입니다.

properties
필수

이 웹 서비스를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다.

description
필수
str

이 웹 서비스를 제공하는 설명입니다.

gpu_cores
필수
int

이 웹 서비스에 할당할 GPU 코어 수입니다. 기본값은 0입니다.

period_seconds
필수
int

활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최소값은 1입니다.

initial_delay_seconds
필수
int

활동성 프로브가 시작되기 전에 컨테이너가 시작된 후의 시간(초)입니다. 기본값은 310입니다.

timeout_seconds
필수
int

활동성 프로브 시간이 초과된 후의 시간(초)입니다. 기본값은 2초입니다. 최소값은 1입니다.

success_threshold
필수
int

활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최소값은 1입니다.

failure_threshold
필수
int

Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes는 포기하기 전에 시간을 시도 failureThreshold 합니다. 기본값은 3입니다. 최소값은 1입니다.

namespace
필수
str

이 웹 서비스를 배포할 Kubernetes 네임스페이스: 최대 63개의 소문자 영숫자('a'-'z', '0'-'9') 및 하이픈('-') 문자. 첫 번째 문자와 마지막 문자는 하이픈일 수 없습니다.

token_auth_enabled
필수

이 Webservice에 대해 Azure Active Directory 인증을 사용하도록 설정할지 여부입니다. 이 기능을 사용하도록 설정하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 Webservice에 액세스할 수 있습니다. 기본값은 False입니다.

compute_target_name
필수
str

배포할 컴퓨팅 대상의 이름

cpu_cores_limit
필수

이 Webservice에서 사용할 수 있는 최대 CPU 코어 수입니다. 10진수일 수 있습니다.

memory_gb_limit
필수

이 웹 서비스에서 사용할 수 있는 최대 메모리 양(GB)입니다. 10진수일 수 있습니다.

blobfuse_enabled
필수

이 웹 서비스에 대한 모델 다운로드에 blobfuse를 사용하도록 설정할지 여부입니다. 기본값: True

변수

Name Description
autoscale_enabled

이 웹 서비스에 대해 자동 크기 조정을 사용하도록 설정할지 여부를 나타냅니다. None인 경우 num_replicas 기본값은 True입니다.

autoscale_min_replicas
int

이 웹 서비스를 자동 크기 조정할 때 사용할 최소 컨테이너 수입니다. 기본값은 1입니다.

autoscale_max_replicas
int

이 웹 서비스를 자동 크기 조정할 때 사용할 최대 컨테이너 수입니다. 기본값은 10입니다.

autoscale_refresh_seconds
int

자동 크기 조정기가 이 웹 서비스의 크기를 조정하려고 시도하는 빈도입니다. 기본값은 1입니다.

autoscale_target_utilization
int

대상 사용률(100점 만점)은 자동 크기 조정기가 이 웹 서비스에 대해 유지 관리하려고 시도해야 합니다. 기본값은 70입니다.

collect_model_data

이 Webservice에 대해 모델 데이터 수집을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

auth_enabled

이 웹 서비스에 대한 인증을 사용하도록 설정할지 여부입니다. 기본값은 True입니다.

cpu_cores

이 웹 서비스에 할당할 CPU 코어 수입니다. 10진수일 수 있습니다. 기본값은 0.1입니다.

memory_gb

이 웹 서비스에 할당할 메모리 양(GB)입니다. 10진수일 수 있습니다. 기본값은 0.5입니다.

enable_app_insights

이 웹 서비스에 Application Insights 로깅을 사용하도록 설정할지 여부입니다. 기본값은 False입니다.

scoring_timeout_ms
int

이 Webservice에 대한 점수 매기기 호출을 적용하는 시간 제한입니다. 기본값은 60000입니다.

replica_max_concurrent_requests
int

이 웹 서비스에 대해 허용할 복제본당 최대 동시 요청 수입니다. 기본값은 1입니다. Microsoft 기술 지원 또는 Azure Machine Learning 팀의 구성원이 지시하지 않는 한 이 설정을 기본값 1에서 변경하지 마세요.

max_request_wait_time
int

503 오류를 반환하기 전에 요청이 큐에 유지되는 최대 시간(밀리초)입니다. 기본값은 500입니다.

num_replicas
int

이 웹 서비스에 할당할 컨테이너 수입니다. 기본값이 아닙니다. 이 매개 변수가 설정되지 않은 경우 자동 크기 조정기는 기본적으로 사용하도록 설정됩니다.

primary_key
str

이 웹 서비스에 사용할 기본 인증 키입니다.

secondary_key
str

이 웹 서비스에 사용할 보조 인증 키입니다.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

이 Webservice에 제공할 키 값 태그의 사전입니다.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

이 웹 서비스를 제공할 키 값 속성의 사전입니다. 배포 후에는 이러한 속성을 변경할 수 없지만 새 키 값 쌍을 추가할 수 있습니다.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

이 웹 서비스를 제공하는 설명입니다.

gpu_cores
int

이 웹 서비스에 할당할 GPU 코어 수입니다. 기본값은 0입니다.

period_seconds
int

활동성 프로브를 수행하는 빈도(초)입니다. 기본값은 10초입니다. 최소값은 1입니다.

initial_delay_seconds
int

활동성 프로브가 시작되기 전에 컨테이너가 시작된 후의 시간(초)입니다. 기본값은 310입니다.

timeout_seconds
int

활동성 프로브 시간이 초과된 후의 시간(초)입니다. 기본값은 2초입니다. 최소값은 1입니다.

success_threshold
int

활동성 프로브가 실패한 후 성공한 것으로 간주되는 최소 연속 성공 횟수입니다. 기본값은 1입니다. 최소값은 1입니다.

failure_threshold
int

Pod가 시작되고 활동성 프로브가 실패하면 Kubernetes는 포기하기 전에 시간을 시도 failureThreshold 합니다. 기본값은 3입니다. 최소값은 1입니다.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

이 웹 서비스를 배포할 Kubernetes 네임스페이스: 최대 63개의 소문자 영숫자('a'-'z', '0'-'9') 및 하이픈('-') 문자. 첫 번째 문자와 마지막 문자는 하이픈일 수 없습니다.

token_auth_enabled

이 Webservice에 대해 Azure Active Directory 인증을 사용하도록 설정할지 여부입니다. 이 기능을 사용하도록 설정하면 사용자는 Azure Active Directory 자격 증명을 사용하여 액세스 토큰을 가져와 이 Webservice에 액세스할 수 있습니다. 기본값은 False입니다.

메서드

print_deploy_configuration

배포 구성을 인쇄합니다.

validate_configuration

지정된 구성 값이 유효한지 확인합니다.

유효성 검사에 실패하면 WebserviceException이 발생합니다.

print_deploy_configuration

배포 구성을 인쇄합니다.

print_deploy_configuration()

validate_configuration

지정된 구성 값이 유효한지 확인합니다.

유효성 검사에 실패하면 WebserviceException이 발생합니다.

validate_configuration()

예외

형식 Description