İçeriğe geç

ImageNet Veri Kümesi

ImageNet, görsel nesne tanıma araştırmalarında kullanılmak üzere tasarlanmış, açıklamalı görüntülerden oluşan büyük ölçekli bir veri tabanıdır. 14 milyondan fazla görüntü içerir ve her görüntü WordNet eşanlamlı kümeleri kullanılarak açıklanmıştır. Bu da onu bilgisayar görüşü görevlerinde derin öğrenme modellerini eğitmek için mevcut olan en kapsamlı kaynaklardan biri yapar.

ImageNet Önceden Eğitilmiş Modeller

Model boyut
(piksel)
acc
top1
acc
top5
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(Milyar) - 224
YOLO11n-cls 224 70.0 89.4 5.0 ± 0.3 1.1 ± 0.0 1.6 0.5
YOLO11s-cls 224 75.4 92.7 7.9 ± 0.2 1.3 ± 0.0 5.5 1.6
YOLO11m-cls 224 77.3 93.9 17.2 ± 0.4 2.0 ± 0.0 10.4 5.0
YOLO11l-cls 224 78.3 94.3 23.2 ± 0.3 2.8 ± 0.0 12.9 6.2
YOLO11x-cls 224 79.5 94.9 41.4 ± 0.9 3.8 ± 0.0 28.4 13.7

Temel Özellikler

  • ImageNet, binlerce nesne kategorisine yayılan 14 milyondan fazla yüksek çözünürlüklü görüntü içerir.
  • Veri kümesi, her bir eşanlam kümesinin bir kategoriyi temsil ettiği WordNet hiyerarşisine göre düzenlenmiştir.
  • ImageNet, özellikle görüntü sınıflandırma ve nesne algılama görevleri için bilgisayar görüşü alanında eğitim ve kıyaslama için yaygın olarak kullanılmaktadır.
  • Yıllık ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), bilgisayar görüşü araştırmalarını ilerletmede etkili olmuştur.

Veri Seti Yapısı

ImageNet veri seti, WordNet hiyerarşisi kullanılarak düzenlenmiştir. Hiyerarşideki her düğüm bir kategoriyi temsil eder ve her kategori bir eş anlamlı kümesi (eş anlamlı terimler koleksiyonu) tarafından açıklanır. ImageNet'teki görüntüler bir veya daha fazla eş anlamlı kümesiyle açıklanmıştır ve bu da çeşitli nesneleri ve bunların ilişkilerini tanımak için modelleri eğitmek için zengin bir kaynak sağlamaktadır.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC)

Yıllık ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), bilgisayar görüşü alanında önemli bir etkinlik olmuştur. Araştırmacılar ve geliştiriciler için algoritmalarını ve modellerini standartlaştırılmış değerlendirme metriklerine sahip büyük ölçekli bir veri seti üzerinde değerlendirmeleri için bir platform sağlamıştır. ILSVRC, görüntü sınıflandırması, nesne algılama ve diğer bilgisayar görüşü görevleri için derin öğrenme modellerinin geliştirilmesinde önemli ilerlemelere yol açmıştır.

Uygulamalar

ImageNet veri seti, görüntü sınıflandırma, nesne algılama ve nesne lokalizasyonu gibi çeşitli bilgisayarlı görü görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılır. AlexNet, VGG ve ResNet gibi bazı popüler derin öğrenme mimarileri, ImageNet veri seti kullanılarak geliştirilmiş ve kıyaslanmıştır.

Kullanım

224x224 görüntü boyutuyla 100 epoch için ImageNet veri kümesi üzerinde bir derin öğrenme modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Mevcut argümanların kapsamlı bir listesi için, model Eğitim sayfasına bakın.

Eğitim Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet model=yolo11n-cls.pt epochs=100 imgsz=224

Örnek Görüntüler ve Açıklamalar

ImageNet veri seti, bilgisayar görüşü modellerini eğitmek ve değerlendirmek için çeşitli ve kapsamlı bir veri seti sağlayan binlerce nesne kategorisine yayılan yüksek çözünürlüklü görüntüler içerir. İşte veri setinden bazı görüntü örnekleri:

Veri kümesi örnek görüntüleri

Bu örnek, ImageNet veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını sergileyerek, güçlü bilgisayarlı görü modelleri eğitmek için çeşitli bir veri kümesinin önemini vurgulamaktadır.

Alıntılar ve Teşekkürler

Araştırma veya geliştirme çalışmalarınızda ImageNet veri kümesini kullanırsanız, lütfen aşağıdaki makaleye atıfta bulunun:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Makine öğrenimi ve bilgisayarla görü araştırma topluluğu için değerli bir kaynak olarak ImageNet veri kümesini oluşturdukları ve sürdürdükleri için Olga Russakovsky, Jia Deng ve Li Fei-Fei liderliğindeki ImageNet ekibine teşekkür etmek isteriz. ImageNet veri kümesi ve yaratıcıları hakkında daha fazla bilgi için ImageNet web sitesini ziyaret edin.

SSS

ImageNet veri seti nedir ve bilgisayar görüşünde nasıl kullanılır?

ImageNet veri kümesi, WordNet eş anlamlı kümeleri kullanılarak kategorize edilmiş 14 milyondan fazla yüksek çözünürlüklü görüntüden oluşan büyük ölçekli bir veritabanıdır. Görüntü sınıflandırma ve nesne algılama dahil olmak üzere görsel nesne tanıma araştırmalarında yaygın olarak kullanılır. Veri kümesinin açıklamaları ve büyük hacmi, derin öğrenme modellerini eğitmek için zengin bir kaynak sağlar. Özellikle, AlexNet, VGG ve ResNet gibi modeller ImageNet kullanılarak eğitilmiş ve kıyaslanmıştır ve bu da bilgisayar görüşünü geliştirmedeki rolünü göstermektedir.

ImageNet veri kümesinde görüntü sınıflandırması için önceden eğitilmiş bir YOLO modelini nasıl kullanabilirim?

ImageNet veri kümesinde görüntü sınıflandırması için önceden eğitilmiş bir Ultralytics YOLO modeli kullanmak için şu adımları izleyin:

Eğitim Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet model=yolo11n-cls.pt epochs=100 imgsz=224

Daha kapsamlı eğitim talimatları için Eğitim sayfamıza bakın.

ImageNet veri kümesi projelerim için neden Ultralytics YOLO11 önceden eğitilmiş modellerini kullanmalıyım?

Ultralytics YOLO11 önceden eğitilmiş modelleri, çeşitli bilgisayar görüşü görevleri için hız ve doğruluk açısından en üstün performansı sunar. Örneğin, %70,0'lık bir top-1 doğruluğu ve %89,4'lük bir top-5 doğruluğu ile YOLO11n-cls modeli, gerçek zamanlı uygulamalar için optimize edilmiştir. Önceden eğitilmiş modeller, sıfırdan eğitim için gereken hesaplama kaynaklarını azaltır ve geliştirme döngülerini hızlandırır. ImageNet Önceden Eğitilmiş Modeller bölümünde YOLO11 modellerinin performans metrikleri hakkında daha fazla bilgi edinin.

ImageNet veri kümesi nasıl yapılandırılmıştır ve neden önemlidir?

ImageNet veri seti, WordNet hiyerarşisi kullanılarak düzenlenmiştir; burada hiyerarşideki her düğüm, bir eş anlamlı kümesi (eş anlamlı terimler koleksiyonu) tarafından açıklanan bir kategoriyi temsil eder. Bu yapı, ayrıntılı ek açıklamalara olanak tanıyarak, çok çeşitli nesneleri tanımak için modelleri eğitmek için idealdir. ImageNet'in çeşitliliği ve ek açıklama zenginliği, sağlam ve genellenebilir derin öğrenme modelleri geliştirmek için onu değerli bir veri seti haline getirmektedir. Bu organizasyon hakkında daha fazla bilgiyi Veri Seti Yapısı bölümünde bulabilirsiniz.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması'nın (ILSVRC) bilgisayar görüşünde rolü nedir?

Yıllık ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), algoritmaları büyük ölçekli, standartlaştırılmış bir veri seti üzerinde değerlendirmek için rekabetçi bir platform sağlayarak bilgisayar görüşündeki gelişmeleri yönlendirmede çok önemli olmuştur. Görüntü sınıflandırması, nesne algılama ve görüntü segmentasyonu gibi alanlarda yeniliği ve gelişimi teşvik eden standartlaştırılmış değerlendirme metrikleri sunar. Yarışma, derin öğrenme ve bilgisayar görüşü teknolojileriyle mümkün olanın sınırlarını sürekli olarak zorlamıştır.



📅 1 yıl önce oluşturuldu ✏️ 4 ay önce güncellendi

Yorumlar