실시간 유추를 위해 새로운 배포를 안전하게 롤아웃합니다.

2025-05-03

적용 대상:Azure CLI ml 확장 v2(현재)Python SDK azure-ai-ml v2(현재)

이 문서에서는 중단을 일으키지 않고 프로덕션 환경에서 새 버전의 기계 학습 모델을 배포하는 방법을 알아보세요. 안전한 출시 전략이라고도 하는 청록색 배포 전략을 사용하여 새 버전의 웹 서비스를 프로덕션에 도입합니다. 이 전략을 사용하면 완전히 롤아웃하기 전에 새 버전의 웹 서비스를 소수의 사용자 또는 요청으로 롤아웃할 수 있습니다.

이 문서에서는 온라인 엔드포인트 또는 온라인(실시간) 추론에 사용되는 엔드포인트를 사용한다고 가정합니다. 온라인 엔드포인트에는 관리형 온라인 엔드포인트와 Kubernetes 온라인 엔드포인트의 두 가지 유형이 있습니다. 엔드포인트 및 엔드포인트 유형 간의 차이점에 대한 자세한 내용은 관리형 온라인 엔드포인트와 Kubernetes 온라인 엔드포인트를 참조하세요.

이 문서에서는 배포에 관리되는 온라인 엔드포인트를 사용합니다. 그러나 관리형 온라인 엔드포인트 대신 Kubernetes 엔드포인트를 사용하는 방법을 설명하는 참고 사항도 포함되어 있습니다.

이 문서에서는 다음 방법을 알아봅니다.

첫 번째 버전의 모델을 배포하기 위해 blue 배포를 사용하여 온라인 엔드포인트를 정의합니다.
blue 더 많은 요청을 처리할 수 있도록 배포 크기를 조정합니다.
모델의 두 번째 버전인 green 배포를 엔드포인트에 배포하되, 그 배포에 라이브 트래픽을 보내지 않습니다.
green을(를) 격리하여 배포를 테스트합니다.
일부 비율의 라이브 트래픽을 green 배포에 반영하여 유효성을 검사합니다.
라이브 트래픽의 작은 비율을 green 배포에 보냅니다.
모든 라이브 트래픽을 green 배포 환경으로 보냅니다.
사용하지 않는 blue 배포를 삭제합니다.

필수 조건

Azure CLI 및 ml Azure CLI에 대한 확장(설치 및 구성됨)입니다. 자세한 내용은 CLI 설치 및 설정(v2)을 참조하세요.
Bash 셸 또는 호환되는 셸(예: Linux 시스템의 셸 또는 Linux용 Windows 하위 시스템). 이 문서의 Azure CLI 예제에서는 이 유형의 셸을 사용한다고 가정합니다.
Azure Machine Learning 작업 영역 작업 영역을 만드는 지침은 설정(Set up)을 참조하세요.

다음 Azure RBAC(Azure 역할 기반 액세스 제어) 역할 중 하나 이상이 있는 사용자 계정:
- Azure Machine Learning 작업 영역에 대한 소유자 역할
- Azure Machine Learning 작업 영역에 대한 기여자 역할
- 권한이 있는 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* 사용자 지정 역할
자세한 내용은 Azure Machine Learning 작업 영역에 대한 액세스 관리를 참조하세요.
필요에 따라 로컬로 설치 및 실행되는 Docker 엔진입니다. 이 필수 구성 요소는 매우 권장됩니다. 모델을 로컬로 배포하는 데 필요하며 디버깅에 유용합니다.

적용 대상: Python SDK azure-ai-ml v2(현재)

Azure Machine Learning 작업 영역 작업 영역을 만드는 단계는 작업 영역 만들기를 참조하세요.
Python v2용 Azure Machine Learning SDK. SDK를 설치하려면 다음 명령을 사용합니다.
```
pip install azure-ai-ml azure-identity
```
기존 SDK 설치를 최신 버전으로 업데이트하려면 다음 명령을 사용합니다.
```
pip install --upgrade azure-ai-ml azure-identity
```
자세한 내용은 Python용 Azure Machine Learning 패키지 클라이언트 라이브러리를 참조하세요.

다음 Azure RBAC(Azure 역할 기반 액세스 제어) 역할 중 하나 이상이 있는 사용자 계정:
- Azure Machine Learning 작업 영역에 대한 소유자 역할
- Azure Machine Learning 작업 영역에 대한 기여자 역할
- 권한이 있는 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* 사용자 지정 역할
자세한 내용은 Azure Machine Learning 작업 영역에 대한 액세스 관리를 참조하세요.
필요에 따라 로컬로 설치 및 실행되는 Docker 엔진입니다. 이 필수 구성 요소는 매우 권장됩니다. 모델을 로컬로 배포하는 데 필요하며 디버깅에 유용합니다.

Azure 구독 Azure 구독이 없는 경우, 시작하기 전에 무료 계정을 만드십시오.
Azure Machine Learning 작업 영역 작업 영역을 만드는 방법에 대한 지침은 작업 영역 만들기를 참조하세요.
다음 Azure RBAC(Azure 역할 기반 액세스 제어) 역할 중 하나 이상이 있는 사용자 계정:
- Azure Machine Learning 작업 영역에 대한 소유자 역할
- Azure Machine Learning 작업 영역에 대한 기여자 역할
- 권한이 있는 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* 사용자 지정 역할
자세한 내용은 Azure Machine Learning 작업 영역에 대한 액세스 관리를 참조하세요.

시스템 준비

환경 변수 설정

Azure CLI와 함께 사용하도록 기본값을 구성할 수 있습니다. 구독, 작업 영역 및 리소스 그룹에 대한 값을 여러 번 전달하지 않도록 하려면 다음 코드를 실행합니다.

az account set --subscription <subscription-ID>
az configure --defaults workspace=<Azure-Machine-Learning-workspace-name> group=<resource-group-name>

예제 리포지토리 복제

이 문서를 따르려면 먼저 예제 리포지토리(azureml-examples)를 복제합니다. 그런 다음, 리포지토리의 cli/ 디렉터리로 이동합니다.

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples
cd cli

팁

리포지토리에 대한 최신 커밋만 복제하는 데 사용 --depth 1 하므로 작업을 완료하는 데 필요한 시간이 줄어듭니다.

이 자습서의 명령은 cli 디렉터리의 deploy-safe-rollout-online-endpoints.sh 파일에 있으며 YAML 구성 파일은 엔드포인트/온라인/관리/샘플/하위 디렉터리에 있습니다.

참고 항목

Kubernetes 온라인 엔드포인트에 대한 YAML 구성 파일은 엔드포인트/온라인/kubernetes/하위 디렉터리에 있습니다.

예제 리포지토리 복제

학습 예제를 실행하려면 먼저 예제 리포지토리(azureml-examples)를 복제합니다. 그런 다음, azureml-examples/sdk/python/endpoints/online/managed directory로 이동합니다.

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/sdk/python/endpoints/online/managed

팁

리포지토리에 대한 최신 커밋만 복제하는 데 사용 --depth 1 하므로 작업을 완료하는 데 필요한 시간이 줄어듭니다.

이 문서의 정보는 online-endpoints-safe-rollout.ipynb Notebook을 기반으로 합니다. 이 문서에는 Notebook과 동일한 콘텐츠가 포함되어 있지만 코드 블록의 순서는 두 문서 간에 약간 다릅니다.

참고 항목

Kubernetes 온라인 엔드포인트에 대한 단계는 kubernetes-online-endpoints-safe-rollout.ipynb Notebook을 기반으로 합니다.

Azure Machine Learning 작업 영역에 연결

작업 영역은 Azure Machine Learning의 최상위 리소스입니다. 작업 영역은 Azure Machine Learning을 사용할 때 만드는 모든 아티팩트를 사용할 수 있는 중앙 집중식 위치를 제공합니다. 이 섹션에서는 배포 작업을 수행하는 작업 영역에 연결합니다. 따라가려면 online-endpoints-safe-rollout.ipynb Notebook을 엽니다.

필요한 라이브러리 가져오기:

# import required libraries
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
    ManagedOnlineEndpoint,
    ManagedOnlineDeployment,
    Model,
    Environment,
    CodeConfiguration,
)
from azure.identity import DefaultAzureCredential

참고 항목

Kubernetes 온라인 엔드포인트를 사용하는 경우 KubernetesOnlineEndpoint 및 KubernetesOnlineDeployment 클래스를 azure.ai.ml.entities 라이브러리에서 가져옵니다.

작업 영역 설정을 구성하고 작업 영역에 대한 핸들을 가져옵니다.

작업 영역에 연결하려면 식별자 매개 변수(구독, 리소스 그룹 및 작업 영역 이름)가 필요합니다. MLClient 클래스에서 모듈의 azure.ai.ml 정보를 사용하여 필요한 Azure Machine Learning 작업 영역에 대한 핸들을 얻습니다. 이 예제에서는 기본 Azure 인증을 사용합니다.
```
# enter details of your AML workspace
subscription_id = "<SUBSCRIPTION_ID>"
resource_group = "<RESOURCE_GROUP>"
workspace = "<AML_WORKSPACE_NAME>"
```
```
# get a handle to the workspace
ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)
```

로컬 컴퓨터에 Git이 설치되어 있는 경우 지침에 따라 예제 리포지토리를 복제할 수 있습니다. 그렇지 않으면 지침에 따라 예제 리포지토리에서 파일을 다운로드합니다.

예제 리포지토리 복제

이 문서를 따라가려면 azureml-examples 리포지토리를 복제한 다음 azureml-examples/cli/endpoints/online/model-1 폴더로 이동합니다.

git clone --depth 1 https://github.com/Azure/azureml-examples
cd azureml-examples/cli/endpoints/online/model-1

팁

리포지토리에 대한 최신 커밋만 복제하는 데 사용 --depth 1 하므로 작업을 완료하는 데 필요한 시간이 줄어듭니다.

예제 리포지토리에서 파일 다운로드

예제 리포지토리를 복제하는 대신 로컬 컴퓨터에 리포지토리를 다운로드할 수 있습니다.

https://github.com/Azure/azureml-examples/(으)로 이동합니다.
코드를 선택한 <>다음 로컬 탭으로 이동하여 ZIP 다운로드를 선택합니다.

엔드포인트 및 배포 정의

온라인 엔드포인트는 온라인(실시간) 유추에 사용됩니다. 온라인 엔드포인트에는 클라이언트에서 데이터를 수신할 준비가 되어 있고 실시간으로 응답을 다시 보내는 배포가 포함됩니다.

엔드포인트 정의

다음 표에는 엔드포인트를 정의할 때 지정할 주요 특성이 나열되어 있습니다.

attribute	필수 또는 선택 사항	설명
이름	필수	엔드포인트의 이름입니다. Azure 지역 내에서 유일해야 합니다. 명명 규칙에 대한 자세한 내용은 Azure Machine Learning 온라인 엔드포인트 및 일괄 처리 엔드포인트를 참조하세요.
인증 모드	선택적	엔드포인트에 대한 인증 방법입니다. 키 기반 인증 `key`과 Azure Machine Learning 토큰 기반 인증 `aml_token`중에서 선택할 수 있습니다. 키는 만료되지 않지만 토큰은 만료됩니다. 인증에 대한 자세한 내용은 온라인 엔드포인트에 대한 클라이언트 인증을 참조하세요.
설명	선택적	엔드포인트에 대한 설명입니다.
태그	선택적	엔드포인트에 대한 태그 사전입니다.
트래픽	선택적	배포 간에 트래픽을 라우팅하는 방법에 대한 규칙입니다. 트래픽을 키-값 쌍의 사전으로 나타냅니다. 여기서 키는 배포 이름을 나타내고 값은 해당 배포에 대한 트래픽의 비율을 나타냅니다. 엔드포인트에서 배포를 만든 후에만 트래픽을 설정할 수 있습니다. 배포를 만든 후 온라인 엔드포인트에 대한 트래픽을 업데이트할 수도 있습니다. 미러된 트래픽을 사용하는 방법에 대한 자세한 내용은 새 배포에 약간의 라이브 트래픽 할당을 참조하세요.
트래픽 미러링	선택적	배포에 미러링할 라이브 트래픽의 백분율입니다. 미러된 트래픽을 사용하는 방법에 대한 자세한 내용은 미러된 트래픽을 사용하여 배포 테스트를 참조하세요.

엔드포인트를 만들 때 지정할 수 있는 특성의 전체 목록을 보려면 CLI(v2) 온라인 엔드포인트 YAML 스키마를 참조하세요. Python용 Azure Machine Learning SDK 버전 2는 ManagedOnlineEndpoint 클래스를 참조하세요.

배포 정의

배포는 실제 추론을 수행하는 모델을 호스팅하는 데 필요한 리소스 집합입니다. 다음 표에서는 배포를 정의할 때 지정하는 주요 특성에 대해 설명합니다.

attribute	필수 또는 선택 사항	설명
이름	필수	배포 이름입니다.
엔드포인트 이름	필수	배포를 만들 엔드포인트의 이름입니다.
모델	선택적	배포에 사용할 모델입니다. 이 값은 작업 영역에서 기존 버전의 모델에 대한 참조 또는 인라인 모델 사양일 수 있습니다. 이 문서의 예제에서 `scikit-learn` 모델은 회귀 작업을 수행합니다.
코드 경로	선택적	모델 채점을 위한 모든 Python 소스 코드가 포함된 로컬 개발 환경의 폴더 경로입니다. 중첩된 디렉터리 및 패키지를 사용할 수 있습니다.
채점 스크립트	선택적	지정된 입력 요청에 따라 모델을 실행하는 Python 코드. 이 값은 소스 코드 폴더의 점수 매기기 파일에 대한 상대 경로일 수 있습니다. 채점 스크립트는 배포된 웹 서비스에 제출된 데이터를 수신하여 모델에 전달합니다. 그런 다음 스크립트는 모델을 실행하고 응답을 클라이언트에 반환합니다. 채점 스크립트는 모델에 따라 다르며 모델이 입력으로 예상하고 출력으로 반환하는 데이터를 이해해야 합니다. 이 문서의 예제에서는 score.py 파일을 사용합니다. 이 Python 코드에는 `init` 함수와 `run` 함수가 있어야 합니다. `init` 이 함수는 모델을 만들거나 업데이트한 후에 호출됩니다. 예를 들어 메모리에 모델을 캐시하는 데 사용할 수 있습니다. `run` 함수는 실제 채점/예측을 수행하도록 엔드포인트를 호출할 때마다 호출됩니다.
환경	필수	모델 및 코드를 호스팅할 환경입니다. 이 값은 작업 영역에서 기존 버전의 환경에 대한 참조 또는 인라인 환경 사양일 수 있습니다. 환경은 Conda 종속성이 있는 Docker 이미지, Dockerfile 또는 등록된 환경일 수 있습니다.
인스턴스 유형	필수	배포에 사용할 가상 머신 크기입니다. 지원되는 크기 목록은 관리형 온라인 엔드포인트 SKU 목록을 참조하세요.
인스턴트 수	필수	배포에 사용할 인스턴스 수입니다. 예상한 워크로드에 따라 가치를 평가합니다. 고가용성을 위해 세 개 이상의 인스턴스를 사용하는 것이 좋습니다. Azure Machine Learning은 업그레이드를 수행하기 위해 20%를 추가로 예약합니다. 자세한 내용은 Azure Machine Learning 온라인 엔드포인트 및 일괄 처리 엔드포인트를 참조하세요.

배포를 만들 때 지정할 수 있는 특성의 전체 목록을 보려면 CLI(v2) 관리형 온라인 배포 YAML 스키마를 참조하세요. Python SDK 버전 2는 ManagedOnlineDeployment 클래스를 참조하세요.

온라인 엔드포인트 만들기

먼저 엔드포인트 이름을 설정한 다음 구성합니다. 이 문서에서는 엔드포인트/온라인/관리/샘플/endpoint.yml 파일을 사용하여 엔드포인트를 구성합니다. 해당 파일에는 다음 줄이 포함됩니다.

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineEndpoint.schema.json
name: my-endpoint
auth_mode: key

다음 표에서는 엔드포인트 YAML 형식에서 사용하는 키를 설명합니다. 이러한 특성을 지정하는 방법을 보려면 CLI(v2) 온라인 엔드포인트 YAML 스키마를 참조하세요. 관리되는 온라인 엔드포인트와 관련된 제한에 대한 자세한 내용은 Azure Machine Learning 온라인 엔드포인트 및 일괄 처리 엔드포인트를 참조하세요.

키	설명
`$schema`	(선택 사항) YAML 스키마입니다. YAML 파일에서 사용 가능한 모든 옵션을 보려면 브라우저의 이전 코드 블록에서 스키마를 볼 수 있습니다.
`name`	엔드포인트의 이름입니다.
`auth_mode`	인증 모드입니다. 키 기반 인증의 경우 `key`를 사용합니다. Azure Machine Learning 토큰 기반 인증에 대해 `aml_token`을 사용합니다. 최신 토큰을 가져오려면 `az ml online-endpoint get-credentials` 명령을 사용합니다.

온라인 엔드포인트를 만들려면 다음을 수행합니다.

다음 Unix 명령을 실행하여 엔드포인트 이름을 설정합니다. YOUR_ENDPOINT_NAME을 고유한 이름으로 바꿉니다.
```
export ENDPOINT_NAME="<YOUR_ENDPOINT_NAME>"
```
중요합니다

엔드포인트 이름은 Azure 지역 내에서 고유해야 합니다. 예를 들어 Azure westus2 지역에는 이름이 my-endpoint인 엔드포인트 하나만 있을 수 있습니다.
다음 코드를 실행하여 클라우드에서 엔드포인트를 만듭니다. 이 코드는 endpoint.yml 파일을 사용하여 엔드포인트를 구성합니다.
```
az ml online-endpoint create --name $ENDPOINT_NAME -f endpoints/online/managed/sample/endpoint.yml
```

파란색 배포 생성하기

엔드포인트/온라인/관리/샘플/blue-deployment.yml 파일을 사용하여 명명된 blue배포의 주요 측면을 구성할 수 있습니다. 해당 파일에는 다음 줄이 포함됩니다.

$schema: https://azuremlschemas.azureedge.net/latest/managedOnlineDeployment.schema.json
name: blue
endpoint_name: my-endpoint
model:
  path: ../../model-1/model/
code_configuration:
  code: ../../model-1/onlinescoring/
  scoring_script: score.py
environment: 
  conda_file: ../../model-1/environment/conda.yaml
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu22.04:latest
instance_type: Standard_DS3_v2
instance_count: 1

blue-deployment.yml 파일을 사용하여 엔드포인트에 대한 blue 배포를 생성하려면 다음 명령어를 실행하세요.

az ml online-deployment create --name blue --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/blue-deployment.yml --all-traffic

중요합니다

az ml online-deployment create 명령의 --all-traffic 플래그는 새로 만든 blue 배포로 엔드포인트 트래픽의 100%를 할당합니다.

blue-deployment.yaml 파일에서 줄은 path 파일을 업로드할 위치를 지정합니다. Azure Machine Learning CLI는 이 정보를 사용하여 파일을 업로드하고 모델 및 환경을 등록합니다. 프로덕션을 위한 모범 사례로, 모델 및 환경을 등록하고 YAML 코드에서 등록된 이름과 버전을 별도로 지정해야 합니다. 예를 들어 model: azureml:my-model:1모델에 대한 형식 model: azureml:<model-name>:<model-version> 을 사용합니다. 환경의 경우 형식 environment: azureml:<environment-name>:<environment-version>을 사용합니다. 예를 들어, environment: azureml:my-env:1가 있습니다.

등록을 수행하려면 model 및 environment의 YAML 정의를 별도의 YAML 파일에 추출하고 az ml model create 및 az ml environment create 명령을 사용할 수 있습니다. 이러한 명령에 대해 자세히 알아보려면 az ml model create -h 및 az ml environment create -h을 실행하십시오.

모델을 자산으로 등록하는 방법에 대한 자세한 내용은 Azure CLI 또는 Python SDK를 사용하여 모델 등록을 참조하세요. 환경을 만드는 방법에 대한 자세한 내용은 사용자 지정 환경 만들기를 참조하세요.

온라인 엔드포인트 만들기

관리형 온라인 엔드포인트를 만들려면 ManagedOnlineEndpoint 클래스를 사용합니다. 이 클래스는 엔드포인트의 주요 측면을 구성하는 방법을 제공합니다.

엔드포인트 구성:

# Creating a unique endpoint name with current datetime to avoid conflicts
import random

online_endpoint_name = "endpt-moe-" + str(random.randint(0, 10000))

# create an online endpoint
endpoint = ManagedOnlineEndpoint(
    name=online_endpoint_name,
    description="this is a sample online endpoint",
    auth_mode="key",
    tags={"foo": "bar"},
)

참고 항목

Kubernetes 온라인 엔드포인트를 만들려면 KubernetesOnlineEndpoint 클래스를 사용합니다.

엔드포인트 만들기:

ml_client.online_endpoints.begin_create_or_update(endpoint).result()

파란색 배포 만들기

관리형 온라인 엔드포인트에 대한 배포를 만들려면 ManagedOnlineDeployment 클래스를 사용합니다. 이 클래스는 배포의 주요 측면을 구성하는 방법을 제공합니다.

blue 배포를 구성하십시오.
```
# create blue deployment
model = Model(path="../model-1/model/sklearn_regression_model.pkl")
env = Environment(
    conda_file="../model-1/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

blue_deployment = ManagedOnlineDeployment(
    name="blue",
    endpoint_name=online_endpoint_name,
    model=model,
    environment=env,
    code_configuration=CodeConfiguration(
        code="../model-1/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)
```
이 예제에서 매개 변수는 path 파일을 업로드할 위치를 지정합니다. Python SDK는 이 정보를 사용하여 파일을 업로드하고 모델 및 환경을 등록합니다. 프로덕션을 위한 모범 사례로 모델 및 환경을 등록하고 코드에 등록된 이름과 버전을 별도로 지정해야 합니다.

모델을 자산으로 등록하는 방법에 대한 자세한 내용은 Azure CLI 또는 Python SDK를 사용하여 모델 등록을 참조하세요.

환경을 만드는 방법에 대한 자세한 내용은 사용자 지정 환경 만들기를 참조하세요.

참고 항목

Kubernetes 온라인 엔드포인트에 대한 배포를 만들려면 KubernetesOnlineDeployment 클래스를 사용합니다.

배포 만들기:

ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.online_endpoints.begin_create_or_update(endpoint).result()

Azure Machine Learning Studio에서 관리되는 온라인 엔드포인트를 만들 때 엔드포인트에 대한 초기 배포를 정의해야 합니다. 배포를 정의하려면 먼저 작업 영역에 등록된 모델이 있어야 합니다. 다음 섹션에서는 배포에 사용할 모델을 등록하는 방법을 보여줍니다.

장치 등록

모델 등록은 작업 영역의 논리적 엔터티입니다. 이 엔터티는 단일 모델 파일 또는 여러 파일의 디렉터리를 포함할 수 있습니다. 프로덕션을 위한 모범 사례로 모델 및 환경을 등록해야 합니다.

예제 모델을 등록하려면 다음 섹션의 단계를 수행합니다.

모델 파일 업로드

Azure Machine Learning 스튜디오로 이동합니다.
모델을 선택합니다.
등록을 선택한 다음 로컬 파일에서 선택합니다.
모델 유형에서 지정되지 않은 형식을 선택합니다.
찾아보기를 선택한 다음 폴더 찾아보기를 선택합니다.
이전에 복제하거나 다운로드한 리포지토리의 로컬 복사본으로 이동한 다음 \azureml-examples\cli\endpoints\online\model-1\model을 선택합니다. 메시지가 표시되면 업로드를 선택하고 업로드 가 완료될 때까지 기다립니다.
다음을 선택합니다.

모델 구성 및 등록

모델 설정 페이지의 이름 아래에서 모델의 이름을 입력합니다. 이 문서의 단계에서는 모델 이름이 model-1이라고 가정합니다.
다음을 선택한 다음 등록을 선택하여 등록을 완료합니다.

이 문서의 이후 예제에서는 리포지토리의 로컬 복사본에 \azureml-examples\cli\endpoints\online\model-2\model 폴더에서 모델을 등록해야 합니다. 해당 모델을 등록하려면 이전 두 섹션의 단계를 반복하지만 모델의 model-2이름을 지정합니다.

등록된 모델을 사용하는 방법에 대한 자세한 내용은 Azure Machine Learning에서 등록된 모델 작업(Work with Registered Model)을 참조하세요.

스튜디오에서 환경을 만드는 방법에 대한 자세한 내용은 환경 만들기를 참조하세요.

관리되는 온라인 엔드포인트 및 파란색 배포 만들기

Azure Machine Learning 스튜디오를 사용하여 브라우저에서 직접 관리되는 온라인 엔드포인트를 만들 수 있습니다. 스튜디오에서 관리형 온라인 엔드포인트를 만들 때 초기 배포를 정의해야 합니다. 비어 있는 관리형 온라인 엔드포인트를 만들 수 없습니다.

스튜디오에서 관리형 온라인 엔드포인트를 만드는 한 가지 방법은 모델 페이지에서 사용하는 것입니다. 이 방법은 또한 기존의 관리형 온라인 배포에 모델을 추가하는 쉬운 방법을 제공합니다. 모델 등록 섹션에서 이전에 등록한 이름을 지정 model-1 한 모델을 배포하려면 다음 섹션의 단계를 수행 합니다 .

모델 선택

Azure Machine Learning 스튜디오로 이동한 다음, 모델을 선택합니다.
목록에서 모델을 선택합니다 model-1 .
배포>실시간 엔드포인트를 선택합니다.

엔드포인트에 대한 자세한 정보를 지정하는 데 사용할 수 있는 창이 열립니다.

초기 설정 구성

엔드포인트 이름 아래에 엔드포인트의 이름을 입력합니다.
Compute 유형에서는 기본값 Managed를 유지합니다.
인증 유형에서 키 기반 인증의 기본값을 유지합니다.
다음을 선택한 다음 모델 페이지에서 다음을 선택합니다.

나머지 설정 구성 및 배포 만들기

배포 페이지에서 다음 단계를 수행합니다.
1. 배포 이름 아래에 파란색을 입력합니다.
2. 나중에 스튜디오에서 엔드포인트 활동의 그래프를 보려면 다음을 수행합니다.
  1. 유추 데이터 컬렉션에서 토글을 켭니다.
  2. Application Insights 진단에서 전환 스위치를 켜십시오.
3. 다음을 선택합니다.
추론을 위한 코드 및 환경에서 다음 단계를 수행합니다.
1. 추론을 위한 점수 매기기 스크립트 선택에서찾아보기를 선택한 다음, 이전에 복제하거나 다운로드한 리포지토리에서 \azureml-examples\cli\endpoints\online\model-1\onlinescoring\score.py 파일을 선택합니다.
2. 환경 목록 위의 검색 상자에서 sklearn을 입력한 다음 sklearn-1.5:19 큐레이팅된 환경을 선택합니다.
3. 다음을 선택합니다.
컴퓨팅 페이지에서 다음 단계를 수행합니다.
1. 가상 머신에서 기본값을 유지합니다.
2. 인스턴스 수에서 기본값을 1로 바꿉다.
3. 다음을 선택합니다.
라이브 트래픽 페이지에서 다음을 선택하여 blue 배포에 100%의 기본 트래픽 할당을 수락합니다.
검토 페이지에서 배포 설정을 검토한 다음 만들기를 선택합니다.

엔드포인트 페이지에서 엔드포인트 만들기

또는 스튜디오의 엔드포인트 페이지에서 관리형 온라인 엔드포인트를 만들 수 있습니다.

Azure Machine Learning 스튜디오로 이동합니다.
엔드포인트를 선택합니다.
선택하고생성합니다.

엔드포인트 및 배포에 대한 자세한 정보를 지정하는 데 사용할 수 있는 창이 열립니다.
모델을 선택한 후 선택을 클릭합니다.
이전 두 섹션에 설명된 대로 엔드포인트 및 배포에 대한 설정을 입력합니다. 각 단계에서 기본값을 사용하고 마지막 단계에서 만들기 를 선택하여 배포를 만듭니다.

기존 배포 확인

기존 배포를 확인하는 한 가지 방법은 지정된 입력 요청에 대해 모델의 점수를 매길 수 있도록 엔드포인트를 호출하는 것입니다. Azure CLI 또는 Python SDK를 통해 엔드포인트를 호출할 때 들어오는 트래픽을 수신할 배포의 이름을 지정하도록 선택할 수 있습니다.

참고 항목

Azure CLI 또는 Python SDK와 달리 Azure Machine Learning Studio에서는 엔드포인트를 호출할 때 배포를 지정해야 합니다.

배포 이름을 사용하여 엔드포인트 호출

엔드포인트를 호출할 때 트래픽을 수신하려는 배포의 이름을 지정할 수 있습니다. 이 경우 Azure Machine Learning은 엔드포인트 트래픽을 지정된 배포로 직접 라우팅하고 출력을 반환합니다. Azure Machine Learning CLI v2에 대한 옵션 또는 deployment_namePython SDK v2에 대한 옵션을 사용하여 --deployment-name 배포를 지정할 수 있습니다.

배포를 지정하지 않고 엔드포인트 호출

트래픽을 수신하려는 배포를 지정하지 않고 엔드포인트를 호출하는 경우 Azure Machine Learning은 트래픽 제어 설정에 따라 엔드포인트의 들어오는 트래픽을 엔드포인트의 배포로 라우팅합니다.

트래픽 제어 설정은 지정된 비율의 수신 트래픽을 엔드포인트의 각 배포에 할당합니다. 예를 들어 트래픽 규칙에서 엔드포인트의 특정 배포가 들어오는 트래픽을 40% 수신하도록 지정하는 경우 Azure Machine Learning은 엔드포인트 트래픽의 40%를 해당 배포로 라우팅합니다.

기존 엔드포인트 및 배포의 상태를 보려면 다음 명령을 실행합니다.

az ml online-endpoint show --name $ENDPOINT_NAME 

az ml online-deployment show --name blue --endpoint $ENDPOINT_NAME

출력에는 $ENDPOINT_NAME 엔드포인트와 blue 배포에 대한 정보가 나열됩니다.

샘플 데이터를 사용하여 엔드포인트 테스트

invoke 명령을 사용하여 엔드포인트를 호출할 수 있습니다. 다음 명령은 sample-request.json JSON 파일을 사용하여 샘플 요청을 보냅니다.

az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json

다음 코드를 사용하여 모델 배포의 상태를 확인합니다.

ml_client.online_endpoints.get(name=online_endpoint_name)

샘플 데이터를 사용하여 엔드포인트 테스트

앞에서 만든 인스턴스 MLClient 를 사용하여 엔드포인트에 대한 핸들을 가져올 수 있습니다. 엔드포인트를 호출하려면 다음 매개 변수와 invoke 함께 명령을 사용할 수 있습니다.

endpoint_name: 엔드포인트의 이름입니다.
request_file: 요청 데이터가 포함된 파일
deployment_name: 엔드포인트에서 테스트할 배포의 이름

다음 코드는 sample-request.json JSON 파일을 사용하여 샘플 요청을 보냅니다.

# test the blue deployment with some sample data
ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="../model-1/sample-request.json",
)

관리형 온라인 엔드포인트 보기

스튜디오 엔드포인트 페이지에서 관리되는 모든 온라인 엔드포인트를 볼 수 있습니다. 각 엔드포인트 페이지의 세부 정보 탭에는 엔드포인트 URI, 상태, 테스트 도구, 활동 모니터, 배포 로그 및 샘플 사용 코드와 같은 중요한 정보가 표시됩니다. 이 정보를 보려면 다음 단계를 수행합니다.

스튜디오에서 엔드포인트를 선택합니다. 작업 영역의 모든 엔드포인트 목록이 표시됩니다.
필요에 따라 컴퓨팅 인스턴스 형식에 대한 필터를 만들어 관리되는 형식만 표시합니다.
엔드포인트의 세부 정보 페이지를 보려면 엔드포인트 이름을 선택합니다.

샘플 데이터를 사용하여 엔드포인트 테스트

엔드포인트 페이지에서 테스트 탭을 사용하여 관리되는 온라인 배포를 테스트할 수 있습니다. 샘플 입력을 입력하고 결과를 보려면 다음 단계를 수행합니다.

엔드포인트 페이지에서 테스트 탭으로 이동합니다. 배포 목록에서 배포가 blue 이미 선택되어 있습니다.
sample-request.json 파일로 이동하여 샘플 입력을 복사합니다.
스튜디오에서 입력 상자에 샘플 입력을 붙여넣습니다.
테스트를 선택합니다.

더 많은 트래픽을 처리하도록 기존 배포 스케일링

배포 YAML 파일에서 instance_count 값을 1로 설정합니다. 이 설정은 온라인 엔드포인트를 사용하여 기계 학습 모델 배포 및 점수 매기기에 설명된 배포에서 이루어집니다. 다음 명령을 사용하여 스케일 아웃할 수 있습니다.update

az ml online-deployment update --name blue --endpoint-name $ENDPOINT_NAME --set instance_count=2

참고 항목

이전 명령의 --set 옵션은 배포 구성을 재정의합니다. 또는 YAML 파일을 업데이트하고 --file 옵션을 사용하여 update 명령에 입력으로 전달할 수 있습니다.

이전에 생성한 인스턴스 MLClient를 사용하여 배포에 대한 참조를 얻을 수 있습니다. 배포 크기를 조정하려면 값을 instance_count늘리거나 줄일 수 있습니다.

# scale the deployment
blue_deployment = ml_client.online_deployments.get(
    name="blue", endpoint_name=online_endpoint_name
)
blue_deployment.instance_count = 2
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

엔드포인트에 대한 자세한 정보 가져오기

# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

인스턴스 수를 조정하여 배포를 확장 또는 축소하려면 다음 단계를 수행합니다.

엔드포인트 페이지에서 세부 정보 탭으로 이동하여 배포용 카드를 찾습니다 blue .
배포 카드의 헤더에서 blue 편집 아이콘을 선택합니다.
인스턴스 수에서 2를 입력합니다.
업데이트를 선택합니다.

새 모델을 배포하지만 트래픽을 보내지 않음

green이라는 새 배포를 만듭니다.

az ml online-deployment create --name green --endpoint-name $ENDPOINT_NAME -f endpoints/online/managed/sample/green-deployment.yml

트래픽을 green 배포에 명시적으로 할당하지 않았기 때문에, 할당된 트래픽은 0으로 설정됩니다. 다음 명령을 사용하여 해당 사실을 확인할 수 있습니다.

az ml online-endpoint show -n $ENDPOINT_NAME --query traffic

새 배포 테스트

비록 green 배포에 할당된 트래픽이 0%이지만, --deployment 옵션을 사용하여 직접 호출할 수 있습니다.

az ml online-endpoint invoke --name $ENDPOINT_NAME --deployment-name green --request-file endpoints/online/model-2/sample-request.json

REST 클라이언트를 사용하여 트래픽 규칙을 거치지 않고 배포를 직접 호출하려면 다음 HTTP 헤더를 설정합니다. azureml-model-deployment: <deployment-name> 다음 코드에서는 CURL(Client for URL)을 사용하여 배포를 직접 호출합니다. Unix 또는 WSL(Linux용 Windows 하위 시스템) 환경에서 코드를 실행할 수 있습니다. 값을 검색하는 $ENDPOINT_KEY 방법에 대한 지침은 데이터 평면 작업에 대한 키 또는 토큰 가져오기를 참조하세요.

# get the scoring uri
SCORING_URI=$(az ml online-endpoint show -n $ENDPOINT_NAME -o tsv --query scoring_uri)
# use curl to invoke the endpoint
curl --request POST "$SCORING_URI" --header "Authorization: Bearer $ENDPOINT_KEY" --header 'Content-Type: application/json' --header "azureml-model-deployment: green" --data @endpoints/online/model-2/sample-request.json

관리되는 온라인 엔드포인트에 대한 새 배포를 만들고 배포 green이름을 다음과 같이 지정합니다.

# create green deployment
model2 = Model(path="../model-2/model/sklearn_regression_model.pkl")
env2 = Environment(
    conda_file="../model-2/environment/conda.yaml",
    image="mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04",
)

green_deployment = ManagedOnlineDeployment(
    name="green",
    endpoint_name=online_endpoint_name,
    model=model2,
    environment=env2,
    code_configuration=CodeConfiguration(
        code="../model-2/onlinescoring", scoring_script="score.py"
    ),
    instance_type="Standard_DS3_v2",
    instance_count=1,
)

# use MLClient to create green deployment
ml_client.online_deployments.begin_create_or_update(green_deployment).result()

참고 항목

Kubernetes 온라인 엔드포인트에 대한 배포를 만드는 경우 클래스를 KubernetesOnlineDeployment 사용하고 Kubernetes 클러스터에서 Kubernetes 인스턴스 유형을 지정합니다.

새 배포 테스트

배포에 green 할당된 트래픽의 0%가 있는 경우에도 엔드포인트 및 배포를 호출할 수 있습니다. 다음 코드는 sample-request.json JSON 파일을 사용하여 샘플 요청을 보냅니다.

ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="green",
    request_file="../model-2/sample-request.json",
)

관리되는 온라인 엔드포인트에 추가할 새 배포를 만들 수 있습니다. 이름이 지정된 green배포를 만들려면 다음 섹션의 단계를 수행합니다.

초기 설정 구성

엔드포인트 페이지에서 세부 정보 탭으로 이동한 다음 배포 추가를 선택합니다.
모델 선택 페이지에서 model-2를 선택한 다음 확인을 클릭합니다.
엔드포인트 페이지와 모델 페이지에서 다음을 선택합니다.
배포 페이지에서 다음 단계를 수행합니다.
1. 배포 이름 아래에 녹색을 입력합니다.
2. 유추 데이터 컬렉션에서 토글을 켭니다.
3. Application Insights 진단에서 전환 스위치를 활성화합니다.
4. 다음을 선택합니다.
추론을 위한 코드 및 환경에서 다음 단계를 수행합니다.
1. 추론에 대한 점수 매기기 스크립트 선택에서찾아보기를 선택한 다음 이전에 복제하거나 다운로드한 리포지토리에서 \azureml-examples\cli\endpoints\online\model-2\onlinescoring\score.py 파일을 선택합니다.
2. 환경 목록 위의 검색 상자에서 sklearn을 입력한 다음 sklearn-1.5:19 큐레이팅된 환경을 선택합니다.
3. 다음을 선택합니다.
컴퓨팅 페이지에서 다음 단계를 수행합니다.
1. 가상 머신에서 기본값을 유지합니다.
2. 인스턴스 수에서 기본값을 1로 바꿉다.
3. 다음을 선택합니다.

나머지 설정 구성 및 배포 만들기

라이브 트래픽 페이지에서 다음을 선택하여 blue 배포에 100%의 기본 트래픽 할당을, green에는 0% 할당을 허용합니다.
검토 페이지에서 배포 설정을 검토한 다음 만들기를 선택합니다.

모델 페이지에서 배포 추가

또는 모델 페이지를 사용하여 배포를 추가할 수 있습니다.

스튜디오에서 모델을 선택합니다.
목록에서 모델을 선택합니다.
배포>실시간 엔드포인트를 선택합니다.
엔드포인트에서 기존을 선택합니다.
엔드포인트 목록에서 모델을 배포할 관리되는 온라인 엔드포인트를 선택한 다음, 다음을 선택합니다.
모델 페이지에서 다음을 선택합니다.
배포 만들기를 green 완료하려면 초기 설정 구성 섹션의 4~6단계와 나머지 설정 구성 의 모든 단계를 수행하고 배포 섹션을 만듭니다.

참고 항목

엔드포인트에 새 배포를 추가할 때 트래픽 할당 업데이트 페이지를 사용하여 배포 간의 트래픽 균형을 조정할 수 있습니다. 이 문서의 나머지 절차를 따르기 위해, blue 배포에 기본 트래픽 할당을 100%로, green 배포에 0%로 유지하십시오.

새 배포 테스트

트래픽의 0%가 green 배포로 이동하지만, 여전히 해당 엔드포인트와 배포를 호출할 수 있습니다. 엔드포인트 페이지에서 테스트 탭을 사용하여 관리되는 온라인 배포를 테스트할 수 있습니다. 샘플 입력을 입력하고 결과를 보려면 다음 단계를 수행합니다.

엔드포인트 페이지에서 테스트 탭으로 이동합니다.
배포 목록에서 녹색을 선택합니다.
sample-request.json 파일로 이동하여 샘플 입력을 복사합니다.
스튜디오에서 입력 상자에 샘플 입력을 붙여넣습니다.
테스트를 선택합니다.

미러링된 트래픽으로 배포 테스트

green 배포를 테스트한 후에는 라이브 트래픽의 일정 비율을 복사하여 해당 비율의 트래픽을 미러링하고, 이를 엔드포인트에 전송하여 green 배포로 보낼 수 있습니다. 섀도링이라고도 하는 트래픽 미러링에서는 클라이언트에 반환되는 결과를 변경하지 않습니다. 요청의 100%는 여전히 배포로 blue 흐릅니다. 트래픽의 미러된 백분율은 복사되어 green 배포에 전송되므로, 클라이언트에 영향을 주지 않고 메트릭 및 로깅을 수집할 수 있습니다.

미러링은 클라이언트에 영향을 주지 않고 새 배포의 유효성을 검사하려는 경우에 유용합니다. 예를 들어 미러링을 사용하여 대기 시간이 허용 가능한 범위 내에 있는지 확인하거나 HTTP 오류가 없는지 확인할 수 있습니다. 트래픽 미러링 또는 섀도링을 사용하여 새 배포를 테스트하는 것을 섀도 테스트라고도 합니다. 미러된 트래픽을 수신하는 배포(이 경우 green 배포)를 섀도 배포라고도 할 수 있습니다.

미러링에는 다음과 같은 제한 사항이 있습니다.

미러링이 Azure Machine Learning CLI 버전 2.4.0 이상 및 Python SDK 버전 1.0.0 이상에서 지원됩니다. 이전 버전의 Azure Machine Learning CLI 또는 Python SDK를 사용하여 엔드포인트를 업데이트하는 경우 미러 트래픽 설정이 손실됩니다.
미러링은 현재 Kubernetes 온라인 엔드포인트에 대해 지원되지 않습니다.
엔드포인트에서 하나의 배포에만 트래픽을 미러링할 수 있습니다.
미러링할 수 있는 트래픽의 최대 비율은 50%입니다. 이 상한은 기본값이 5MBps인 엔드포인트 대역폭 할당량에 미치는 영향을 제한합니다. 할당된 할당량을 초과하면 엔드포인트 대역폭이 제한됩니다. 대역폭 제한을 모니터링하는 방법에 대한 자세한 내용은 대역폭 제한을 참조하세요.

또한 다음 동작에 유의하세요.

배포를 구성하여 라이브 트래픽 또는 미러된 트래픽 중 하나만 수신할 수 있으며, 두 가지를 동시에 수신할 수는 없습니다.
엔드포인트를 호출할 때 해당 배포 중 아무 배포의 이름—섀도 배포 포함—을 지정하여 예측을 반환할 수 있습니다.
엔드포인트를 호출하고 들어오는 트래픽을 수신하는 배포의 이름을 지정하면 Azure Machine Learning은 트래픽을 섀도 배포로 미러링하지 않습니다. Azure Machine Learning은 배포를 지정하지 않은 경우 엔드포인트로 전송된 트래픽에서 섀도 배포로 트래픽을 미러링합니다.

green 배포를 미러링된 트래픽의 10%를 수신하도록 설정하더라도, 클라이언트는 여전히 blue 배포에서만 예측을 받습니다.

엔드포인트를 통한 트래픽 흐름을 보여 주는 다이어그램 모든 트래픽은 파란색 배포로 이동하고 10%는 녹색 배포에 미러됩니다.

다음 명령을 사용하여 트래픽의 10%를 복제하여 green 배포로 보냅니다.

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=10"

들어오는 트래픽을 수신하도록 배포를 지정하지 않고 엔드포인트를 여러 번 호출하여 미러된 트래픽을 테스트할 수 있습니다.

for i in {1..20} ; do
    az ml online-endpoint invoke --name $ENDPOINT_NAME --request-file endpoints/online/model-1/sample-request.json
done

배포에서 로그를 확인하여 지정된 트래픽 백분율이 green 배포로 전송되는지 확인할 수 있습니다.

az ml online-deployment get-logs --name green --endpoint $ENDPOINT_NAME

테스트 후 미러 트래픽을 0으로 설정하여 미러링을 사용하지 않도록 설정할 수 있습니다.

az ml online-endpoint update --name $ENDPOINT_NAME --mirror-traffic "green=0"

다음 코드를 사용하여 트래픽의 10%를 미러링하고 green 배포에 보냅니다.

endpoint.mirror_traffic = {"green": 10}
ml_client.begin_create_or_update(endpoint).result()

들어오는 트래픽을 수신하도록 배포를 지정하지 않고 엔드포인트를 여러 번 호출하여 미러된 트래픽을 테스트할 수 있습니다.

# You can test mirror traffic by invoking the endpoint several times
for i in range(20):
    ml_client.online_endpoints.invoke(
        endpoint_name=online_endpoint_name,
        request_file="../model-1/sample-request.json",
    )

배포의 로그를 확인하여 지정된 백분율의 트래픽이 green 배포로 전송되는 것을 확인할 수 있습니다.

ml_client.online_deployments.get_logs(
    name="green", endpoint_name=online_endpoint_name, lines=50
)

테스트 후 미러 트래픽을 0으로 설정하여 미러링을 사용하지 않도록 설정할 수 있습니다.

endpoint.mirror_traffic = {"green": 0}
ml_client.begin_create_or_update(endpoint).result()

트래픽의 10%를 복제하여 green 배포로 보내려면 다음 단계를 수행합니다.

엔드포인트 페이지에서 세부 정보 탭으로 이동한 다음 트래픽 업데이트를 선택합니다.
미러된 트래픽 사용 설정을 켭니다.
배포 이름 목록에서 녹색을 선택합니다.
트래픽 할당 %기본값인 10%를 유지합니다.
업데이트를 선택합니다.

이제 엔드포인트 세부 정보 페이지에는 green 배포로 10%의 미러된 트래픽 할당이 표시됩니다.

미러링된 트래픽을 테스트하려면 Azure CLI 또는 Python 탭을 참조하여 엔드포인트를 여러 번 호출합니다. 지정된 트래픽 백분율이 green 배포로 전송되는지 배포의 로그를 확인하여 확인합니다. 로그 탭으로 이동하여 엔드포인트 페이지의 배포 로그에 액세스할 수 있습니다 .

메트릭 및 로그를 사용하여 미러된 트래픽의 성능을 모니터링할 수도 있습니다. 자세한 내용은 온라인 엔드포인트 모니터링을 참조하세요.

테스트 후 다음 단계를 수행하여 미러링을 사용하지 않도록 설정할 수 있습니다.

엔드포인트 페이지에서 세부 정보 탭으로 이동한 다음 트래픽 업데이트를 선택합니다.
미러 트래픽 사용 토글을 꺼주세요.
업데이트를 선택합니다.

라이브 트래픽의 작은 비율을 새 배포에 할당

배포를 green 테스트한 후 소량의 트래픽을 할당합니다.

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=90 green=10"

endpoint.traffic = {"blue": 90, "green": 10}
ml_client.begin_create_or_update(endpoint).result()

팁

트래픽을 사용하지 않으려면 총 트래픽 백분율이 0%여야 하고, 트래픽을 사용하려면 100%여야 합니다.

green 배포는 이제 전체 라이브 트래픽의 10%를 수신합니다. 클라이언트는 blue 배포와 green 배포에서 모두 예측을 받습니다.

엔드포인트를 통한 트래픽 흐름을 보여 주는 다이어그램 파란색 배포는 트래픽의 90%를 수신하고 녹색 배포는 10%를 받습니다.

모든 트래픽을 새 배포로 보냅니다.

배포에 완전히 만족할 때, 모든 트래픽을 해당 배포로 전환하십시오.

az ml online-endpoint update --name $ENDPOINT_NAME --traffic "blue=0 green=100"

endpoint.traffic = {"blue": 0, "green": 100}
ml_client.begin_create_or_update(endpoint).result()

이전 배포 제거

다음 단계에 따라 관리형 온라인 엔드포인트에서 개별 배포를 삭제할 수 있습니다. 개별 배포를 삭제해도 관리되는 온라인 엔드포인트의 다른 배포에는 영향을 주지 않습니다.

az ml online-deployment delete --name blue --endpoint $ENDPOINT_NAME --yes --no-wait

ml_client.online_deployments.begin_delete(
    name="blue", endpoint_name=online_endpoint_name
).wait()

엔드포인트 및 배포 삭제

엔드포인트와 배포를 사용하지 않으려면 삭제해야 합니다. 엔드포인트를 삭제하면 모든 기본 배포도 삭제됩니다.

az ml online-endpoint delete --name $ENDPOINT_NAME --yes --no-wait

ml_client.online_endpoints.begin_delete(name=online_endpoint_name)

다음을 통해 공유

실시간 유추를 위해 새로운 배포를 안전하게 롤아웃합니다.

필수 조건

시스템 준비

환경 변수 설정

예제 리포지토리 복제

엔드포인트 및 배포 정의

엔드포인트 정의

배포 정의

온라인 엔드포인트 만들기

파란색 배포 생성하기

기존 배포 확인

배포 이름을 사용하여 엔드포인트 호출

배포를 지정하지 않고 엔드포인트 호출

샘플 데이터를 사용하여 엔드포인트 테스트

더 많은 트래픽을 처리하도록 기존 배포 스케일링

새 모델을 배포하지만 트래픽을 보내지 않음

새 배포 테스트

미러링된 트래픽으로 배포 테스트

라이브 트래픽의 작은 비율을 새 배포에 할당

모든 트래픽을 새 배포로 보냅니다.

이전 배포 제거

엔드포인트 및 배포 삭제

관련 콘텐츠

피드백

추가 리소스