MNIST Veri Kümesi
MNIST (Modified National Institute of Standards and Technology) veri seti, çeşitli görüntü işleme sistemlerini ve makine öğrenimi modellerini eğitmek için yaygın olarak kullanılan, el yazısıyla yazılmış rakamlardan oluşan geniş bir veritabanıdır. NIST'in orijinal veri setlerinden örnekleri "yeniden karıştırarak" oluşturulmuştur ve görüntü sınıflandırma algoritmalarının performansını değerlendirmek için bir kıyaslama haline gelmiştir.
Temel Özellikler
- MNIST, el yazısıyla yazılmış rakamların 60.000 eğitim görüntüsünü ve 10.000 test görüntüsünü içerir.
- Veri kümesi, 28×28 piksel boyutunda gri tonlamalı görüntülerden oluşmaktadır.
- Görüntüler, 28×28 piksellik bir sınırlayıcı kutuya sığacak şekilde normalleştirilir ve gri tonlama seviyelerini tanıtan kenar yumuşatma uygulanır.
- MNIST, özellikle görüntü sınıflandırma görevleri için makine öğrenimi alanında eğitim ve test için yaygın olarak kullanılmaktadır.
Veri Seti Yapısı
MNIST veri seti iki alt kümeye ayrılmıştır:
- Eğitim Seti: Bu alt küme, makine öğrenimi modellerini eğitmek için kullanılan 60.000 adet el yazısı rakam görüntüsü içerir.
- Test Kümesi: Bu alt küme, eğitilmiş modelleri test etmek ve kıyaslamak için kullanılan 10.000 görüntüden oluşur.
Veri kümesindeki her görüntü, karşılık gelen rakamla (0-9) etiketlenmiştir, bu da onu sınıflandırma görevleri için ideal bir denetimli öğrenme veri kümesi yapar.
Genişletilmiş MNIST (EMNIST)
Genişletilmiş MNIST (EMNIST), NIST tarafından geliştirilen ve MNIST'in halefi olması için yayınlanan daha yeni bir veri kümesidir. MNIST yalnızca el yazısıyla yazılmış rakamların görüntülerini içerirken, EMNIST, el yazısıyla yazılmış büyük ve küçük harflerin yanı sıra rakamların geniş bir veritabanı olan NIST Özel Veritabanı 19'daki tüm görüntüleri içerir. EMNIST'deki görüntüler, MNIST görüntüleriyle aynı işlemle aynı 28×28 piksel formatına dönüştürülmüştür. Buna göre, eski, daha küçük MNIST veri kümesiyle çalışan araçlar, EMNIST ile değiştirilmeden çalışabilir.
Uygulamalar
MNIST veri kümesi, derin öğrenme modellerini görüntü sınıflandırma görevlerinde eğitmek ve değerlendirmek için yaygın olarak kullanılır; örneğin Evrişimsel Sinir Ağları (CNN'ler), Destek Vektör Makineleri (SVM'ler) ve diğer çeşitli makine öğrenimi algoritmaları. Veri kümesinin basit ve iyi yapılandırılmış formatı, onu makine öğrenimi ve bilgisayarlı görü alanındaki araştırmacılar ve uygulayıcılar için önemli bir kaynak haline getirir.
Bazı yaygın uygulamalar şunlardır:
- Yeni sınıflandırma algoritmalarını kıyaslama
- Makine öğrenimi kavramlarını öğretmek için eğitim amaçları
- Görüntü tanıma sistemlerinin prototipini oluşturma
- Model optimizasyon tekniklerini test etme
Kullanım
32×32 görüntü boyutuyla MNIST veri kümesi üzerinde 100 epok için bir CNN modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Mevcut argümanların kapsamlı bir listesi için modelin Eğitim sayfasına bakın.
Eğitim Örneği
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Örnek Görüntüler ve Açıklamalar
MNIST veri kümesi, görüntü sınıflandırma görevleri için iyi yapılandırılmış bir veri kümesi sağlayan, elle yazılmış rakamların gri tonlamalı görüntülerini içerir. İşte veri kümesinden bazı görüntü örnekleri:
Bu örnek, MNIST veri setindeki el yazısıyla yazılmış rakamların çeşitliliğini ve karmaşıklığını sergileyerek, sağlam görüntü sınıflandırma modelleri eğitmek için çeşitli bir veri setinin önemini vurgulamaktadır.
Alıntılar ve Teşekkürler
Araştırma veya geliştirme çalışmalarınızda MNIST veri kümesini kullanırsanız, lütfen aşağıdaki makaleye atıfta bulunun:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
volume={2},
year={2010}
}
Makine öğrenimi ve bilgisayar görüşü araştırma topluluğu için değerli bir kaynak olarak MNIST veri kümesini oluşturan ve sürdüren Yann LeCun, Corinna Cortes ve Christopher J.C. Burges'e teşekkür etmek istiyoruz. MNIST veri kümesi ve yaratıcıları hakkında daha fazla bilgi için MNIST veri kümesi web sitesini ziyaret edin.
SSS
MNIST veri kümesi nedir ve makine öğreniminde neden önemlidir?
MNIST veri seti veya Modified National Institute of Standards and Technology veri seti, görüntü sınıflandırma sistemlerini eğitmek ve test etmek için tasarlanmış, el yazısıyla yazılmış rakamlardan oluşan yaygın olarak kullanılan bir koleksiyondur. Hepsi gri tonlamalı ve 28×28 piksel boyutunda olan 60.000 eğitim görüntüsü ve 10.000 test görüntüsü içerir. Veri setinin önemi, görüntü sınıflandırma algoritmalarını değerlendirmek için standart bir kıyaslama olarak rolünde yatmaktadır ve araştırmacıların ve mühendislerin yöntemleri karşılaştırmasına ve alandaki ilerlemeyi izlemesine yardımcı olmaktadır.
MNIST veri kümesi üzerinde bir model eğitmek için Ultralytics YOLO'yu nasıl kullanabilirim?
Ultralytics YOLO kullanarak MNIST veri setinde bir model eğitmek için şu adımları izleyebilirsiniz:
Eğitim Örneği
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Mevcut eğitim argümanlarının ayrıntılı bir listesi için Eğitim sayfasına bakın.
MNIST ve EMNIST veri kümeleri arasındaki fark nedir?
MNIST veri kümesi yalnızca elle yazılmış rakamlar içerirken, Genişletilmiş MNIST (EMNIST) veri kümesi hem rakamları hem de büyük ve küçük harfleri içerir. EMNIST, MNIST'in halefi olarak geliştirildi ve görüntüler için aynı 28×28 piksel formatını kullanıyor, bu da onu orijinal MNIST veri kümesi için tasarlanmış araçlar ve modellerle uyumlu hale getiriyor. EMNIST'deki bu daha geniş karakter yelpazesi, onu daha çeşitli makine öğrenimi uygulamaları için kullanışlı hale getirir.
MNIST gibi özel veri kümelerinde modelleri eğitmek için Ultralytics HUB'ı kullanabilir miyim?
Evet, MNIST gibi özel veri kümelerinde modelleri eğitmek için Ultralytics HUB'ı kullanabilirsiniz. Ultralytics HUB, veri kümelerini yüklemek, modelleri eğitmek ve kapsamlı kodlama bilgisine ihtiyaç duymadan projeleri yönetmek için kullanıcı dostu bir arayüz sunar. Başlamak için daha fazla ayrıntı için Ultralytics HUB Hızlı Başlangıç sayfasına göz atın.
MNIST, diğer görüntü sınıflandırma veri kümeleriyle nasıl karşılaştırılır?
MNIST, CIFAR-10 veya ImageNet gibi birçok modern veri kümesinden daha basittir, bu da onu yeni başlayanlar ve hızlı deneyler için ideal hale getirir. Daha karmaşık veri kümeleri, renkli görüntüler ve çeşitli nesne kategorileriyle daha büyük zorluklar sunarken, MNIST basitliği, küçük dosya boyutu ve makine öğrenimi algoritmalarının geliştirilmesindeki tarihi önemi nedeniyle değerli olmaya devam ediyor. Daha gelişmiş sınıflandırma görevleri için, aynı yapıyı koruyan ancak rakamlar yerine giyim eşyalarına sahip olan Fashion-MNIST'i kullanmayı düşünebilirsiniz.