적용 대상:Azure CLI ml 확장 v2(현재)
Python SDK azure-ai-ml v2(현재)
이 문서에서는 중단을 일으키지 않고 프로덕션 환경에서 새 버전의 기계 학습 모델을 배포하는 방법을 알아보세요. 안전한 출시 전략이라고도 하는 청록색 배포 전략을 사용하여 새 버전의 웹 서비스를 프로덕션에 도입합니다. 이 전략을 사용하면 완전히 롤아웃하기 전에 새 버전의 웹 서비스를 소수의 사용자 또는 요청으로 롤아웃할 수 있습니다.
이 문서에서는 온라인 엔드포인트 또는 온라인(실시간) 추론에 사용되는 엔드포인트를 사용한다고 가정합니다. 온라인 엔드포인트에는 관리형 온라인 엔드포인트와 Kubernetes 온라인 엔드포인트의 두 가지 유형이 있습니다. 엔드포인트 및 엔드포인트 유형 간의 차이점에 대한 자세한 내용은 관리형 온라인 엔드포인트와 Kubernetes 온라인 엔드포인트를 참조하세요.
이 문서에서는 배포에 관리되는 온라인 엔드포인트를 사용합니다. 그러나 관리형 온라인 엔드포인트 대신 Kubernetes 엔드포인트를 사용하는 방법을 설명하는 참고 사항도 포함되어 있습니다.
이 문서에서는 다음 방법을 알아봅니다.
- 첫 번째 버전의 모델을 배포하기 위해
blue
배포를 사용하여 온라인 엔드포인트를 정의합니다. -
blue
더 많은 요청을 처리할 수 있도록 배포 크기를 조정합니다. - 모델의 두 번째 버전인
green
배포를 엔드포인트에 배포하되, 그 배포에 라이브 트래픽을 보내지 않습니다. -
green
을(를) 격리하여 배포를 테스트합니다. - 일부 비율의 라이브 트래픽을
green
배포에 반영하여 유효성을 검사합니다. - 라이브 트래픽의 작은 비율을
green
배포에 보냅니다. - 모든 라이브 트래픽을
green
배포 환경으로 보냅니다. - 사용하지 않는
blue
배포를 삭제합니다.
필수 조건
Azure CLI 및
ml
Azure CLI에 대한 확장(설치 및 구성됨)입니다. 자세한 내용은 CLI 설치 및 설정(v2)을 참조하세요.Bash 셸 또는 호환되는 셸(예: Linux 시스템의 셸 또는 Linux용 Windows 하위 시스템). 이 문서의 Azure CLI 예제에서는 이 유형의 셸을 사용한다고 가정합니다.
Azure Machine Learning 작업 영역 작업 영역을 만드는 지침은 설정(Set up)을 참조하세요.
다음 Azure RBAC(Azure 역할 기반 액세스 제어) 역할 중 하나 이상이 있는 사용자 계정:
- Azure Machine Learning 작업 영역에 대한 소유자 역할
- Azure Machine Learning 작업 영역에 대한 기여자 역할
- 권한이 있는
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*
사용자 지정 역할
필요에 따라 로컬로 설치 및 실행되는 Docker 엔진입니다. 이 필수 구성 요소는 매우 권장됩니다. 모델을 로컬로 배포하는 데 필요하며 디버깅에 유용합니다.
시스템 준비
환경 변수 설정
Azure CLI와 함께 사용하도록 기본값을 구성할 수 있습니다. 구독, 작업 영역 및 리소스 그룹에 대한 값을 여러 번 전달하지 않도록 하려면 다음 코드를 실행합니다.
az account set --subscription <subscription-ID>
az configure --defaults workspace=<Azure-Machine-Learning-workspace-name> group=<resource-group-name>
예제 리포지토리 복제
이 문서를 따르려면 먼저 예제 리포지토리(azureml-examples)를 복제합니다. 그런 다음, 리포지토리의 cli/
디렉터리로 이동합니다.
git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples
cd cli
팁
리포지토리에 대한 최신 커밋만 복제하는 데 사용 --depth 1
하므로 작업을 완료하는 데 필요한 시간이 줄어듭니다.
이 자습서의 명령은 cli 디렉터리의 deploy-safe-rollout-online-endpoints.sh 파일에 있으며 YAML 구성 파일은 엔드포인트/온라인/관리/샘플/하위 디렉터리에 있습니다.
참고 항목
Kubernetes 온라인 엔드포인트에 대한 YAML 구성 파일은 엔드포인트/온라인/kubernetes/하위 디렉터리에 있습니다.
엔드포인트 및 배포 정의
온라인 엔드포인트는 온라인(실시간) 유추에 사용됩니다. 온라인 엔드포인트에는 클라이언트에서 데이터를 수신할 준비가 되어 있고 실시간으로 응답을 다시 보내는 배포가 포함됩니다.
엔드포인트 정의
다음 표에는 엔드포인트를 정의할 때 지정할 주요 특성이 나열되어 있습니다.
attribute | 필수 또는 선택 사항 | 설명 |
---|---|---|
이름 | 필수 | 엔드포인트의 이름입니다. Azure 지역 내에서 유일해야 합니다. 명명 규칙에 대한 자세한 내용은 Azure Machine Learning 온라인 엔드포인트 및 일괄 처리 엔드포인트를 참조하세요. |
인증 모드 | 선택적 | 엔드포인트에 대한 인증 방법입니다. 키 기반 인증 key 과 Azure Machine Learning 토큰 기반 인증 aml_token 중에서 선택할 수 있습니다. 키는 만료되지 않지만 토큰은 만료됩니다. 인증에 대한 자세한 내용은 온라인 엔드포인트에 대한 클라이언트 인증을 참조하세요. |
설명 | 선택적 | 엔드포인트에 대한 설명입니다. |
태그 | 선택적 | 엔드포인트에 대한 태그 사전입니다. |
트래픽 | 선택적 | 배포 간에 트래픽을 라우팅하는 방법에 대한 규칙입니다. 트래픽을 키-값 쌍의 사전으로 나타냅니다. 여기서 키는 배포 이름을 나타내고 값은 해당 배포에 대한 트래픽의 비율을 나타냅니다. 엔드포인트에서 배포를 만든 후에만 트래픽을 설정할 수 있습니다. 배포를 만든 후 온라인 엔드포인트에 대한 트래픽을 업데이트할 수도 있습니다. 미러된 트래픽을 사용하는 방법에 대한 자세한 내용은 새 배포에 약간의 라이브 트래픽 할당을 참조하세요. |
트래픽 미러링 | 선택적 | 배포에 미러링할 라이브 트래픽의 백분율입니다. 미러된 트래픽을 사용하는 방법에 대한 자세한 내용은 미러된 트래픽을 사용하여 배포 테스트를 참조하세요. |
엔드포인트를 만들 때 지정할 수 있는 특성의 전체 목록을 보려면 CLI(v2) 온라인 엔드포인트 YAML 스키마를 참조하세요. Python용 Azure Machine Learning SDK 버전 2는 ManagedOnlineEndpoint 클래스를 참조하세요.
배포 정의
배포는 실제 추론을 수행하는 모델을 호스팅하는 데 필요한 리소스 집합입니다. 다음 표에서는 배포를 정의할 때 지정하는 주요 특성에 대해 설명합니다.
attribute | 필수 또는 선택 사항 | 설명 |
---|---|---|
이름 | 필수 | 배포 이름입니다. |
엔드포인트 이름 | 필수 | 배포를 만들 엔드포인트의 이름입니다. |
모델 | 선택적 | 배포에 사용할 모델입니다. 이 값은 작업 영역에서 기존 버전의 모델에 대한 참조 또는 인라인 모델 사양일 수 있습니다. 이 문서의 예제에서 scikit-learn 모델은 회귀 작업을 수행합니다. |
코드 경로 | 선택적 | 모델 채점을 위한 모든 Python 소스 코드가 포함된 로컬 개발 환경의 폴더 경로입니다. 중첩된 디렉터리 및 패키지를 사용할 수 있습니다. |
채점 스크립트 | 선택적 | 지정된 입력 요청에 따라 모델을 실행하는 Python 코드. 이 값은 소스 코드 폴더의 점수 매기기 파일에 대한 상대 경로일 수 있습니다. 채점 스크립트는 배포된 웹 서비스에 제출된 데이터를 수신하여 모델에 전달합니다. 그런 다음 스크립트는 모델을 실행하고 응답을 클라이언트에 반환합니다. 채점 스크립트는 모델에 따라 다르며 모델이 입력으로 예상하고 출력으로 반환하는 데이터를 이해해야 합니다. 이 문서의 예제에서는 score.py 파일을 사용합니다. 이 Python 코드에는 init 함수와 run 함수가 있어야 합니다.
init 이 함수는 모델을 만들거나 업데이트한 후에 호출됩니다. 예를 들어 메모리에 모델을 캐시하는 데 사용할 수 있습니다.
run 함수는 실제 채점/예측을 수행하도록 엔드포인트를 호출할 때마다 호출됩니다. |
환경 | 필수 | 모델 및 코드를 호스팅할 환경입니다. 이 값은 작업 영역에서 기존 버전의 환경에 대한 참조 또는 인라인 환경 사양일 수 있습니다. 환경은 Conda 종속성이 있는 Docker 이미지, Dockerfile 또는 등록된 환경일 수 있습니다. |
인스턴스 유형 | 필수 | 배포에 사용할 가상 머신 크기입니다. 지원되는 크기 목록은 관리형 온라인 엔드포인트 SKU 목록을 참조하세요. |
인스턴트 수 | 필수 | 배포에 사용할 인스턴스 수입니다. 예상한 워크로드에 따라 가치를 평가합니다. 고가용성을 위해 세 개 이상의 인스턴스를 사용하는 것이 좋습니다. Azure Machine Learning은 업그레이드를 수행하기 위해 20%를 추가로 예약합니다. 자세한 내용은 Azure Machine Learning 온라인 엔드포인트 및 일괄 처리 엔드포인트를 참조하세요. |
배포를 만들 때 지정할 수 있는 특성의 전체 목록을 보려면 CLI(v2) 관리형 온라인 배포 YAML 스키마를 참조하세요. Python SDK 버전 2는 ManagedOnlineDeployment 클래스를 참조하세요.
온라인 엔드포인트 만들기
먼저 엔드포인트 이름을 설정한 다음 구성합니다. 이 문서에서는 엔드포인트/온라인/관리/샘플/endpoint.yml 파일을 사용하여 엔드포인트를 구성합니다. 해당 파일에는 다음 줄이 포함됩니다.
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key
다음 표에서는 엔드포인트 YAML 형식에서 사용하는 키를 설명합니다. 이러한 특성을 지정하는 방법을 보려면 CLI(v2) 온라인 엔드포인트 YAML 스키마를 참조하세요. 관리되는 온라인 엔드포인트와 관련된 제한에 대한 자세한 내용은 Azure Machine Learning 온라인 엔드포인트 및 일괄 처리 엔드포인트를 참조하세요.
키 | 설명 |
---|---|
$schema |
(선택 사항) YAML 스키마입니다. YAML 파일에서 사용 가능한 모든 옵션을 보려면 브라우저의 이전 코드 블록에서 스키마를 볼 수 있습니다. |
name |
엔드포인트의 이름입니다. |
auth_mode |
인증 모드입니다. 키 기반 인증의 경우 key 를 사용합니다. Azure Machine Learning 토큰 기반 인증에 대해 aml_token 을 사용합니다. 최신 토큰을 가져오려면 az ml online-endpoint get-credentials 명령을 사용합니다. |
온라인 엔드포인트를 만들려면 다음을 수행합니다.
다음 Unix 명령을 실행하여 엔드포인트 이름을 설정합니다.
YOUR_ENDPOINT_NAME
을 고유한 이름으로 바꿉니다.export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
중요합니다
엔드포인트 이름은 Azure 지역 내에서 고유해야 합니다. 예를 들어 Azure
westus2
지역에는 이름이my-endpoint
인 엔드포인트 하나만 있을 수 있습니다.다음 코드를 실행하여 클라우드에서 엔드포인트를 만듭니다. 이 코드는 endpoint.yml 파일을 사용하여 엔드포인트를 구성합니다.
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/managed/sample/endpoint.yml
파란색 배포 생성하기
엔드포인트/온라인/관리/샘플/blue-deployment.yml 파일을 사용하여 명명된 blue
배포의 주요 측면을 구성할 수 있습니다. 해당 파일에는 다음 줄이 포함됩니다.
$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: blue
endpoint_name: my-endpoint
model:
path: ../../model-1/model/
code_configuration:
code: ../../model-1/onlinescoring/
scoring_script: score.py
environment:
conda_file: ../../model-1/environment/conda.yaml
image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu22.04:latest
instance_type: Standard_DS3_v2
instance_count: 1
blue-deployment.yml 파일을 사용하여 엔드포인트에 대한 blue
배포를 생성하려면 다음 명령어를 실행하세요.
az ml online-deployment create --name blue --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/blue-deployment.yml --all-traffic
중요합니다
az ml online-deployment create
명령의 --all-traffic
플래그는 새로 만든 blue
배포로 엔드포인트 트래픽의 100%를 할당합니다.
blue-deployment.yaml 파일에서 줄은 path
파일을 업로드할 위치를 지정합니다. Azure Machine Learning CLI는 이 정보를 사용하여 파일을 업로드하고 모델 및 환경을 등록합니다. 프로덕션을 위한 모범 사례로, 모델 및 환경을 등록하고 YAML 코드에서 등록된 이름과 버전을 별도로 지정해야 합니다. 예를 들어 model: azureml:my-model:1
모델에 대한 형식 model: azureml:<model-name>:<model-version>
을 사용합니다. 환경의 경우 형식 environment: azureml:<environment-name>:<environment-version>
을 사용합니다. 예를 들어, environment: azureml:my-env:1
가 있습니다.
등록을 수행하려면 model
및 environment
의 YAML 정의를 별도의 YAML 파일에 추출하고 az ml model create
및 az ml environment create
명령을 사용할 수 있습니다. 이러한 명령에 대해 자세히 알아보려면 az ml model create -h
및 az ml environment create -h
을 실행하십시오.
모델을 자산으로 등록하는 방법에 대한 자세한 내용은 Azure CLI 또는 Python SDK를 사용하여 모델 등록을 참조하세요. 환경을 만드는 방법에 대한 자세한 내용은 사용자 지정 환경 만들기를 참조하세요.
기존 배포 확인
기존 배포를 확인하는 한 가지 방법은 지정된 입력 요청에 대해 모델의 점수를 매길 수 있도록 엔드포인트를 호출하는 것입니다. Azure CLI 또는 Python SDK를 통해 엔드포인트를 호출할 때 들어오는 트래픽을 수신할 배포의 이름을 지정하도록 선택할 수 있습니다.
참고 항목
Azure CLI 또는 Python SDK와 달리 Azure Machine Learning Studio에서는 엔드포인트를 호출할 때 배포를 지정해야 합니다.
배포 이름을 사용하여 엔드포인트 호출
엔드포인트를 호출할 때 트래픽을 수신하려는 배포의 이름을 지정할 수 있습니다. 이 경우 Azure Machine Learning은 엔드포인트 트래픽을 지정된 배포로 직접 라우팅하고 출력을 반환합니다.
Azure Machine Learning CLI v2에 대한 옵션 또는 deployment_name
Python SDK v2에 대한 옵션을 사용하여 --deployment-name
배포를 지정할 수 있습니다.
배포를 지정하지 않고 엔드포인트 호출
트래픽을 수신하려는 배포를 지정하지 않고 엔드포인트를 호출하는 경우 Azure Machine Learning은 트래픽 제어 설정에 따라 엔드포인트의 들어오는 트래픽을 엔드포인트의 배포로 라우팅합니다.
트래픽 제어 설정은 지정된 비율의 수신 트래픽을 엔드포인트의 각 배포에 할당합니다. 예를 들어 트래픽 규칙에서 엔드포인트의 특정 배포가 들어오는 트래픽을 40% 수신하도록 지정하는 경우 Azure Machine Learning은 엔드포인트 트래픽의 40%를 해당 배포로 라우팅합니다.
기존 엔드포인트 및 배포의 상태를 보려면 다음 명령을 실행합니다.
az ml online-endpoint show --name $ENDPOINT_NAME
az ml online-deployment show --name blue --endpoint $ENDPOINT_NAME
출력에는 $ENDPOINT_NAME
엔드포인트와 blue
배포에 대한 정보가 나열됩니다.
샘플 데이터를 사용하여 엔드포인트 테스트
invoke
명령을 사용하여 엔드포인트를 호출할 수 있습니다. 다음 명령은 sample-request.json JSON 파일을 사용하여 샘플 요청을 보냅니다.
az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
더 많은 트래픽을 처리하도록 기존 배포 스케일링
배포 YAML 파일에서 instance_count
값을 1
로 설정합니다. 이 설정은 온라인 엔드포인트를 사용하여 기계 학습 모델 배포 및 점수 매기기에 설명된 배포에서 이루어집니다. 다음 명령을 사용하여 스케일 아웃할 수 있습니다.update
az ml online-deployment update --name blue --endpoint-name $ENDPOINT_NAME --set instance_count=2
참고 항목
이전 명령의 --set
옵션은 배포 구성을 재정의합니다. 또는 YAML 파일을 업데이트하고 --file
옵션을 사용하여 update
명령에 입력으로 전달할 수 있습니다.
새 모델을 배포하지만 트래픽을 보내지 않음
green
이라는 새 배포를 만듭니다.
az ml online-deployment create --name green --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/green-deployment.yml
트래픽을 green
배포에 명시적으로 할당하지 않았기 때문에, 할당된 트래픽은 0으로 설정됩니다. 다음 명령을 사용하여 해당 사실을 확인할 수 있습니다.
az ml online-endpoint show -n $ENDPOINT_NAME --query traffic
새 배포 테스트
비록 green
배포에 할당된 트래픽이 0%이지만, --deployment
옵션을 사용하여 직접 호출할 수 있습니다.
az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment-name green --request-file endpoints/online/model-2/sample-request.json
REST 클라이언트를 사용하여 트래픽 규칙을 거치지 않고 배포를 직접 호출하려면 다음 HTTP 헤더를 설정합니다. azureml-model-deployment: <deployment-name>
다음 코드에서는 CURL(Client for URL)을 사용하여 배포를 직접 호출합니다. Unix 또는 WSL(Linux용 Windows 하위 시스템) 환경에서 코드를 실행할 수 있습니다. 값을 검색하는 $ENDPOINT_KEY
방법에 대한 지침은 데이터 평면 작업에 대한 키 또는 토큰 가져오기를 참조하세요.
# get the scoring uri
SCORING_URI=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query scoring_uri)
# use curl to invoke the endpoint
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --header "azureml-model-deployment: green" --data @endpoints/online/model-2/sample-request.json
미러링된 트래픽으로 배포 테스트
green
배포를 테스트한 후에는 라이브 트래픽의 일정 비율을 복사하여 해당 비율의 트래픽을 미러링하고, 이를 엔드포인트에 전송하여 green
배포로 보낼 수 있습니다.
섀도링이라고도 하는 트래픽 미러링에서는 클라이언트에 반환되는 결과를 변경하지 않습니다. 요청의 100%는 여전히 배포로 blue
흐릅니다. 트래픽의 미러된 백분율은 복사되어 green
배포에 전송되므로, 클라이언트에 영향을 주지 않고 메트릭 및 로깅을 수집할 수 있습니다.
미러링은 클라이언트에 영향을 주지 않고 새 배포의 유효성을 검사하려는 경우에 유용합니다. 예를 들어 미러링을 사용하여 대기 시간이 허용 가능한 범위 내에 있는지 확인하거나 HTTP 오류가 없는지 확인할 수 있습니다. 트래픽 미러링 또는 섀도링을 사용하여 새 배포를 테스트하는 것을 섀도 테스트라고도 합니다. 미러된 트래픽을 수신하는 배포(이 경우 green
배포)를 섀도 배포라고도 할 수 있습니다.
미러링에는 다음과 같은 제한 사항이 있습니다.
- 미러링이 Azure Machine Learning CLI 버전 2.4.0 이상 및 Python SDK 버전 1.0.0 이상에서 지원됩니다. 이전 버전의 Azure Machine Learning CLI 또는 Python SDK를 사용하여 엔드포인트를 업데이트하는 경우 미러 트래픽 설정이 손실됩니다.
- 미러링은 현재 Kubernetes 온라인 엔드포인트에 대해 지원되지 않습니다.
- 엔드포인트에서 하나의 배포에만 트래픽을 미러링할 수 있습니다.
- 미러링할 수 있는 트래픽의 최대 비율은 50%입니다. 이 상한은 기본값이 5MBps인 엔드포인트 대역폭 할당량에 미치는 영향을 제한합니다. 할당된 할당량을 초과하면 엔드포인트 대역폭이 제한됩니다. 대역폭 제한을 모니터링하는 방법에 대한 자세한 내용은 대역폭 제한을 참조하세요.
또한 다음 동작에 유의하세요.
- 배포를 구성하여 라이브 트래픽 또는 미러된 트래픽 중 하나만 수신할 수 있으며, 두 가지를 동시에 수신할 수는 없습니다.
- 엔드포인트를 호출할 때 해당 배포 중 아무 배포의 이름—섀도 배포 포함—을 지정하여 예측을 반환할 수 있습니다.
- 엔드포인트를 호출하고 들어오는 트래픽을 수신하는 배포의 이름을 지정하면 Azure Machine Learning은 트래픽을 섀도 배포로 미러링하지 않습니다. Azure Machine Learning은 배포를 지정하지 않은 경우 엔드포인트로 전송된 트래픽에서 섀도 배포로 트래픽을 미러링합니다.
green
배포를 미러링된 트래픽의 10%를 수신하도록 설정하더라도, 클라이언트는 여전히 blue
배포에서만 예측을 받습니다.
다음 명령을 사용하여 트래픽의 10%를 복제하여 green
배포로 보냅니다.
az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=10"
들어오는 트래픽을 수신하도록 배포를 지정하지 않고 엔드포인트를 여러 번 호출하여 미러된 트래픽을 테스트할 수 있습니다.
for i in {1..20} ; do
az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
done
배포에서 로그를 확인하여 지정된 트래픽 백분율이 green
배포로 전송되는지 확인할 수 있습니다.
az ml online-deployment get-logs --name green --endpoint $ENDPOINT_NAME
테스트 후 미러 트래픽을 0으로 설정하여 미러링을 사용하지 않도록 설정할 수 있습니다.
az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=0"
라이브 트래픽의 작은 비율을 새 배포에 할당
배포를 green
테스트한 후 소량의 트래픽을 할당합니다.
az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=90 green=10"
팁
트래픽을 사용하지 않으려면 총 트래픽 백분율이 0%여야 하고, 트래픽을 사용하려면 100%여야 합니다.
green
배포는 이제 전체 라이브 트래픽의 10%를 수신합니다. 클라이언트는 blue
배포와 green
배포에서 모두 예측을 받습니다.
모든 트래픽을 새 배포로 보냅니다.
배포에 완전히 만족할 때, 모든 트래픽을 해당 배포로 전환하십시오.
az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=0 green=100"
이전 배포 제거
다음 단계에 따라 관리형 온라인 엔드포인트에서 개별 배포를 삭제할 수 있습니다. 개별 배포를 삭제해도 관리되는 온라인 엔드포인트의 다른 배포에는 영향을 주지 않습니다.
az ml online-deployment delete --name blue --endpoint $ENDPOINT_NAME --yes --no-wait
엔드포인트 및 배포 삭제
엔드포인트와 배포를 사용하지 않으려면 삭제해야 합니다. 엔드포인트를 삭제하면 모든 기본 배포도 삭제됩니다.
az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait