ML.NET CLI는 .NET 개발자를 위한 모델 생성을 자동화합니다.
ML.NET API를 단독으로 사용하려면(ML.NET AutoML CLI가 없으면) 트레이너(특정 작업에 대한 기계 학습 알고리즘 구현) 및 데이터에 적용할 데이터 변환 집합(기능 엔지니어링)을 선택해야 합니다. 최적의 파이프라인은 각 데이터 세트에 따라 다르며 모든 선택 항목에서 최적의 알고리즘을 선택하면 복잡성이 더해집니다. 또한 각 알고리즘에는 튜닝할 하이퍼 매개 변수 집합이 있습니다. 따라서 기능 엔지니어링, 학습 알고리즘 및 하이퍼 매개 변수의 최상의 조합을 찾기 위해 기계 학습 모델 최적화에 몇 주, 때로는 몇 달을 보낼 수 있습니다.
ML.NET CLI는 AutoML(자동화된 기계 학습)을 사용하여 이 프로세스를 간소화합니다.
비고
이 문서에서는 현재 미리 보기로 제공되며 자료가 변경될 수 있는 ML.NET CLI 및 ML.NET AutoML을 참조합니다.
ML.NET CLI(명령줄 인터페이스)란?
ML.NET CLI는 .NET 도구입니다. 설치되면 기계 학습 작업 및 학습 데이터 세트를 제공하고 애플리케이션에서 모델을 사용하기 위해 실행할 C# 코드뿐만 아니라 ML.NET 모델을 생성합니다.
다음 그림과 같이 고품질 ML.NET 모델(직렬화된 모델 .zip 파일)과 샘플 C# 코드를 생성하여 해당 모델을 실행/채점하는 것이 간단합니다. 또한 생성된 "최상의 모델"에 사용되는 알고리즘 및 설정을 연구하고 반복할 수 있도록 해당 모델을 만들고 학습하는 C# 코드도 생성됩니다.
직접 코딩하지 않고 사용자 고유의 데이터 세트에서 해당 자산을 생성할 수 있으므로 이미 ML.NET 알고 있더라도 생산성도 향상됩니다.
현재 ML.NET CLI에서 지원하는 ML 작업은 다음과 같습니다.
- 분류
- 회귀
- 권장 사항
- 이미지 분류
- 예측
- 훈련
ML.NET CLI는 다음 명령을 사용하여 운영 체제 및 해당 아키텍처에 따라 설치할 수 있습니다.
dotnet tool install --global mlnet-<OS>-<ARCH>
예를 들어 x64 버전의 Windows는 다음을 사용하여 설치할 수 있습니다.
dotnet tool install --global mlnet-win-x64
자세한 내용은 ML.NET CLI 설치 방법 가이드를 참조하세요.
사용의 예(분류 시나리오):
mlnet classification --dataset "yelp_labelled.txt" --label-col 1 --has-header false --train-time 10
mbconfig 파일을 사용하여 학습할 수 있는 명령도 있습니다. 모델 작성기 세션을 시작할 때 mbconfig 파일이 만들어집니다.
Windows PowerShell, macOS/Linux bash 또는 Windows CMD에서 동일한 방식으로 실행할 수 있습니다. 그러나 테이블 형식 자동 완성(매개 변수 제안)은 Windows CMD에서 작동하지 않습니다.
생성된 출력 자산
CLI의 ML 작업 명령은 출력 폴더에 다음 자산을 생성합니다.
- C# 솔루션 포함:
- 생성된 모델을 실행/채점하는 콘솔 앱입니다(해당 모델을 사용하여 최종 사용자 앱에서 예측하기 위해).
- 학습 목적 또는 모델 재학습을 위해 해당 모델을 생성하는 데 사용되는 학습 코드가 있는 콘솔 앱입니다.
- 이 직렬화된 모델("최상의 모델")은 예측을 실행하는 데 사용할 준비가 된 압축 된.zip 파일로도 제공됩니다.
- 모델 작성기에서 모델을 열 수 있는 구성 데이터가 포함된 mbconfig 파일입니다.
- 자세한 구성/파이프라인을 포함하여 평가된 여러 알고리즘에서 모든 반복/스윕 정보가 포함된 로그 파일입니다.
처음 두 자산은 최종 사용자 앱(예: Core 웹앱, 서비스 및 데스크톱 앱 ASP.NET)에서 직접 사용하여 생성된 ML 모델로 예측을 수행할 수 있습니다.
세 번째 자산인 학습 코드는 생성된 모델을 학습하기 위해 CLI에서 사용한 ML.NET API 코드를 보여 줍니다. 따라서 모델을 다시 학습시키고 CLI 및 AutoML에서 선택한 특정 트레이너/알고리즘 및 하이퍼 매개 변수를 조사하고 반복할 수 있습니다.
모델의 품질 이해
CLI 도구를 사용하여 '최상의 모델'을 생성하면 대상으로 하는 ML 작업에 적합한 품질 메트릭(예: 정확도 및 R 제곱)이 표시됩니다.
여기서 이러한 메트릭은 자동 생성된 '최상의 모델'의 품질을 이해할 수 있도록 ML 작업별로 그룹화되어 요약됩니다.
분류 모델에 대한 메트릭
다음 이미지는 CLI에서 찾은 상위 5개 모델에 대한 분류 메트릭 목록을 표시합니다.
정확도는 분류 문제에 널리 사용되는 메트릭이지만 다음 참조에 설명된 대로 정확도가 항상 최상의 모델을 선택하는 가장 좋은 메트릭은 아닙니다. 추가 메트릭을 사용하여 모델의 품질을 평가해야 하는 경우가 있습니다.
CLI에서 출력하는 메트릭을 탐색하고 이해하려면 분류에 대한 평가 메트릭을 참조하세요.
회귀 및 권장 사항 모델에 대한 메트릭
관찰된 값과 모델의 예측 값 간의 차이가 작고 편견이 없는 경우 회귀 모델은 데이터에 적합합니다. 회귀는 특정 메트릭을 사용하여 평가할 수 있습니다.
CLI에서 찾은 상위 5개 품질 모델에 대한 유사한 메트릭 목록이 표시됩니다. 이 경우 상위 5개는 회귀 ML 작업과 관련이 있습니다.
CLI에서 출력하는 메트릭을 탐색하고 이해하려면 회귀에 대한 평가 메트릭을 참조하세요.
참고하십시오
.NET