İçeriğe geç

Veri Kümelerine Genel Bakış

Ultralytics, algılama, örnek segmentasyonu, poz tahmini, sınıflandırma ve çoklu nesne takibi gibi bilgisayar görüşü görevlerini kolaylaştırmak için çeşitli veri kümeleri için destek sağlar. Aşağıda, ana Ultralytics veri kümelerinin bir listesi ve ardından her bir bilgisayar görüşü görevinin ve ilgili veri kümelerinin bir özeti bulunmaktadır.



İzle: Ultralytics Veri Kümelerine Genel Bakış

Nesne Algılama

Sınırlayıcı kutu nesne algılama, bir görüntüdeki nesneleri her nesnenin etrafına bir sınırlayıcı kutu çizerek algılamayı ve konumlandırmayı içeren bir bilgisayar görüşü tekniğidir.

  • Argoverse: Zengin açıklamalarla kentsel ortamlardan 3D izleme ve hareket tahmini verileri içeren bir veri kümesi.
  • COCO: Common Objects in Context (COCO), 80 nesne kategorisine sahip, büyük ölçekli bir nesne algılama, segmentasyon ve başlıklandırma veri kümesidir.
  • LVIS: 1203 nesne kategorisine sahip, büyük ölçekli bir nesne algılama, segmentasyon ve başlıklandırma veri kümesidir.
  • COCO8: Hızlı testler için uygun olan COCO train ve COCO val'den ilk 4 görüntünün daha küçük bir alt kümesidir.
  • COCO8-Grayscale: RGB'nin gri tonlamaya dönüştürülmesiyle oluşturulan COCO8'in gri tonlamalı bir versiyonu, tek kanallı model değerlendirmesi için kullanışlıdır.
  • COCO8-Multispectral: RGB dalga boylarını enterpolasyon yaparak oluşturulan COCO8'in 10 kanallı çok spektralli bir versiyonu, spektral duyarlı model değerlendirmesi için kullanışlıdır.
  • COCO128: Testler için uygun olan COCO train ve COCO val'den ilk 128 görüntünün daha küçük bir alt kümesidir.
  • Global Wheat 2020: Global Wheat Challenge 2020 için buğday başaklarının görüntülerini içeren bir veri kümesidir.
  • Objects365: 365 nesne kategorisi ve 600 binden fazla etiketli görüntü ile nesne algılama için yüksek kaliteli, büyük ölçekli bir veri kümesidir.
  • OpenImagesV7: Google tarafından sağlanan, 1,7 milyon eğitim görüntüsü ve 42 bin doğrulama görüntüsü içeren kapsamlı bir veri kümesidir.
  • SKU-110K: 11 binden fazla görüntü ve 1,7 milyon sınırlayıcı kutu ile perakende ortamlarında yoğun nesne algılamayı içeren bir veri kümesidir.
  • HomeObjects-3K Yeni 🚀: Akıllı ev sistemlerinde, robotikte ve artırılmış gerçeklikte bilgisayarlı görü modelleri geliştirmek ve test etmek için ideal olan, 12 yaygın ev eşyasının yer aldığı açıklamalı iç mekan sahnelerinden oluşan bir veri kümesi.
  • VisDrone: 10 binden fazla görüntü ve video sekansı ile drone ile çekilmiş görüntülerden elde edilen nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesidir.
  • VOC: 20 nesne sınıfı ve 11 binden fazla görüntü ile nesne algılama ve segmentasyon için Pascal Visual Object Classes (VOC) veri kümesidir.
  • xView: 60 nesne kategorisi ve 1 milyondan fazla etiketli nesne ile havadan çekilmiş görüntülerde nesne algılama için bir veri kümesidir.
  • RF100: Kapsamlı model değerlendirmesi için yedi görüntüleme alanına yayılan 100 veri kümesiyle çeşitli bir nesne algılama kıyaslama setidir.
  • Brain-tumor: Beyin tümörlerini tespit etmeye yönelik bir veri kümesi, tümör varlığı, konumu ve özellikleri hakkında ayrıntılar içeren MRI veya BT tarama görüntülerini içerir.
  • African-wildlife: Bufalo, fil, gergedan ve zebralar dahil olmak üzere Afrika yaban hayatının görüntülerini içeren bir veri kümesidir.
  • Signature: Belge doğrulama ve sahtecilik tespit araştırmalarını destekleyen, açıklamalı imzalar içeren çeşitli belgelerin görüntülerini içeren bir veri kümesidir.
  • Medical-pills: İlaç kalite kontrolü, sıralama ve endüstri standartlarına uyumun sağlanması gibi görevlere yardımcı olmak için tasarlanmış, etiketlenmiş tıbbi hap görüntüleri içeren bir veri kümesi.

Örnek Segmentasyonu

Örnek segmentasyonu, bir görüntüdeki nesneleri piksel düzeyinde tanımlamayı ve konumlandırmayı içeren bir bilgisayar görüşü tekniğidir. Yalnızca her pikseli sınıflandıran semantik segmentasyonun aksine, örnek segmentasyonu aynı sınıfın farklı örnekleri arasında ayrım yapar.

  • COCO: 200 binden fazla etiketli görüntü ile nesne algılama, segmentasyon ve başlıklandırma görevleri için tasarlanmış büyük ölçekli bir veri kümesidir.
  • COCO8-seg: Segmentasyon açıklamalarıyla 8 COCO görüntüsünün bir alt kümesini içeren, örnek segmentasyonu görevleri için daha küçük bir veri kümesidir.
  • COCO128-seg: Segmentasyon açıklamalarıyla 128 COCO görüntüsünün bir alt kümesini içeren, örnek segmentasyonu görevleri için daha küçük bir veri kümesidir.
  • Crack-seg: Hem nesne algılama hem de segmentasyon görevleri için uygulanabilir olan, yollarda ve duvarlarda çatlakları tespit etmek için özel olarak hazırlanmış bir veri kümesidir.
  • Package-seg: Hem nesne algılama hem de segmentasyon uygulamaları için uygun olan, depolarda veya endüstriyel ortamlarda paketleri tanımlamak için uyarlanmış bir veri kümesidir.
  • Carparts-seg: Tasarım, üretim ve araştırma ihtiyaçlarına yönelik, araç parçalarını tanımlamak için özel olarak oluşturulmuş bir veri kümesidir. Hem nesne algılama hem de segmentasyon görevleri için kullanılır.

Poz Tahmini

Poz tahmini, nesnenin kameraya veya dünya koordinat sistemine göre pozunu belirlemek için kullanılan bir tekniktir. Bu, özellikle insanlar veya hayvanlar olmak üzere nesneler üzerindeki anahtar noktaların veya eklemlerin tanımlanmasını içerir.

  • COCO: Poz tahmini görevleri için tasarlanmış insan pozu açıklamalarına sahip büyük ölçekli bir veri kümesidir.
  • COCO8-pose: İnsan pozu açıklamalarıyla 8 COCO görüntüsünün bir alt kümesini içeren, poz tahmini görevleri için daha küçük bir veri kümesidir.
  • Tiger-pose: Kaplanlara odaklanan 263 görüntüden oluşan kompakt bir veri kümesi; poz tahmini görevleri için her kaplan için 12 anahtar nokta ile işaretlenmiştir.
  • Hand-Keypoints: İnsan ellerine odaklanan 26.000'den fazla görüntü içeren, poz tahmini görevleri için tasarlanmış ve her el için 21 anahtar nokta ile işaretlenmiş özlü bir veri kümesi.
  • Dog-pose: Köpeklere odaklanan yaklaşık 6.000 görüntü içeren, poz tahmini görevleri için uyarlanmış ve her köpek için 24 anahtar nokta ile işaretlenmiş kapsamlı bir veri kümesi.

Sınıflandırma

Görüntü sınıflandırması, bir görüntüyü görsel içeriğine göre önceden tanımlanmış bir veya daha fazla sınıfa veya kategoriye ayırmayı içeren bir bilgisayar görüşü görevidir.

  • Caltech 101: Görüntü sınıflandırma görevleri için 101 nesne kategorisinin görüntülerini içeren bir veri kümesi.
  • Caltech 256: 256 nesne kategorisi ve daha zorlu görüntüler içeren Caltech 101'in genişletilmiş bir sürümü.
  • CIFAR-10: Her sınıfta 6.000 görüntü olmak üzere 10 sınıfta 60.000 adet 32x32 renkli görüntüden oluşan bir veri kümesi.
  • CIFAR-100: 100 nesne kategorisi ve sınıf başına 600 görüntü içeren CIFAR-10'un genişletilmiş bir sürümü.
  • Fashion-MNIST: Görüntü sınıflandırma görevleri için 10 moda kategorisinin 70.000 gri tonlamalı görüntüsünden oluşan bir veri kümesi.
  • ImageNet: 14 milyondan fazla görüntü ve 20.000 kategoriye sahip nesne tespiti ve görüntü sınıflandırması için büyük ölçekli bir veri kümesi.
  • ImageNet-10: Daha hızlı deney ve test için 10 kategoriye sahip ImageNet'in daha küçük bir alt kümesi.
  • Imagenette: Daha hızlı eğitim ve test için kolayca ayırt edilebilen 10 sınıf içeren ImageNet'in daha küçük bir alt kümesi.
  • Imagewoof: Görüntü sınıflandırma görevleri için 10 köpek ırkı kategorisi içeren ImageNet'in daha zorlu bir alt kümesi.
  • MNIST: Görüntü sınıflandırma görevleri için el yazısıyla yazılmış rakamların 70.000 gri tonlamalı görüntüsünden oluşan bir veri kümesi.
  • MNIST160: MNIST veri kümesindeki her MNIST kategorisinin ilk 8 görüntüsü. Veri kümesi toplam 160 görüntü içerir.

Yönlendirilmiş Sınırlayıcı Kutular (OBB)

Yönlendirilmiş Sınırlandırma Kutuları (OBB), genellikle hava ve uydu görüntülerine uygulanan, döndürülmüş sınırlandırma kutuları kullanarak görüntülerdeki açılı nesneleri algılamak için bilgisayar görüşünde kullanılan bir yöntemdir. Geleneksel sınırlandırma kutularının aksine, OBB çeşitli yönlerdeki nesnelere daha iyi uyum sağlayabilir.

  • DOTA-v2: 1,7 milyon örnek ve 11.268 görüntü içeren popüler bir OBB hava görüntüleme veri kümesi.
  • DOTA8: Hızlı testler için uygun olan, DOTAv1 bölünmüş kümesindeki ilk 8 görüntünün daha küçük bir alt kümesi, 4'ü eğitim ve 4'ü doğrulama için.

Çoklu Nesne Takibi

Çoklu nesne takibi, bir video dizisinde zaman içinde birden fazla nesneyi algılamayı ve izlemeyi içeren bir bilgisayar görüşü tekniğidir. Bu görev, nesnelerin kareler arasındaki tutarlı kimliklerini koruyarak nesne algılamayı genişletir.

  • Argoverse: Çoklu nesne izleme görevleri için zengin açıklamalarla kentsel ortamlardan 3D izleme ve hareket tahmini verileri içeren bir veri kümesi.
  • VisDrone: 10 binden fazla görüntü ve video sekansı ile drone ile çekilmiş görüntülerden elde edilen nesne algılama ve çoklu nesne izleme verilerini içeren bir veri kümesidir.

Yeni Veri Kümeleri Katkıda Bulunun

Yeni bir veri kümesine katkıda bulunmak, mevcut altyapıyla iyi uyum sağladığından emin olmak için çeşitli adımlar içerir. Aşağıda gerekli adımlar bulunmaktadır:



İzle: Ultralytics Veri Kümelerine Nasıl Katkıda Bulunulur 🚀

Yeni Bir Veri Kümesi Katkıda Bulunma Adımları

  1. Görüntüleri Toplayın: Veri kümesine ait görüntüleri toplayın. Bunlar, genel veritabanları veya kendi koleksiyonunuz gibi çeşitli kaynaklardan toplanabilir.
  2. Görüntüleri Açıklayın: Bu görüntüleri, göreve bağlı olarak sınırlayıcı kutular, segmentler veya anahtar noktalarla açıklayın.
  3. Açıklamaları Dışa Aktar: Bu açıklamaları YOLO'ya dönüştürün *.txt Ultralytics'in desteklediği dosya formatı.
  4. Veri Kümesini Düzenleyin: Veri kümenizi doğru klasör yapısına göre düzenleyin. Şunlara sahip olmalısınız: train/ ve val/ en üst düzey dizinler ve her birinin içinde bir images/ ve labels/ alt dizin.

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. Bir tane oluşturun data.yaml Dosya: Veri kümenizin kök dizininde, bir tane oluşturun data.yaml veri kümesini, sınıfları ve diğer gerekli bilgileri açıklayan dosya.

  6. Görüntüleri Optimize Edin (İsteğe Bağlı): Daha verimli işleme için veri kümesinin boyutunu küçültmek isterseniz, aşağıdaki kodu kullanarak görüntüleri optimize edebilirsiniz. Bu gerekli değildir, ancak daha küçük veri kümesi boyutları ve daha hızlı indirme hızları için önerilir.
  7. Veri Kümesini Sıkıştırın: Tüm veri kümesi klasörünü bir zip dosyası halinde sıkıştırın.
  8. Belgeleyin ve PR Gönderin: Veri kümenizi ve mevcut çerçeveye nasıl uyduğunu açıklayan bir dokümantasyon sayfası oluşturun. Bundan sonra, bir Çekme İsteği (PR) gönderin. PR gönderme hakkında daha fazla bilgi için Ultralytics Katkı Yönergeleri'ne bakın.

Bir Veri Kümesini Optimize Etmek ve Sıkıştırmak için Örnek Kod

Bir Veri Kümesini Optimize Edin ve Sıkıştırın

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Bu adımları izleyerek, Ultralytics'in mevcut yapısıyla iyi entegre olan yeni bir veri kümesine katkıda bulunabilirsiniz.

SSS

Ultralytics, nesne algılama için hangi veri kümelerini destekliyor?

Ultralytics, nesne algılama için çok çeşitli veri kümelerini destekler, bunlar arasında:

  • COCO: 80 nesne kategorisine sahip, büyük ölçekli bir nesne tespiti, segmentasyonu ve başlıklandırma veri kümesi.
  • LVIS: Daha ayrıntılı nesne tespiti ve segmentasyonu için tasarlanmış, 1203 nesne kategorisine sahip kapsamlı bir veri kümesi.
  • Argoverse: Zengin açıklamalarla kentsel ortamlardan 3D izleme ve hareket tahmini verileri içeren bir veri kümesi.
  • VisDrone: Drone ile çekilmiş görüntülerden elde edilen nesne tespiti ve çoklu nesne izleme verilerine sahip bir veri kümesi.
  • SKU-110K: 11 binden fazla görüntüyle perakende ortamlarında yoğun nesne tespiti içeren.

Bu veri kümeleri, çeşitli nesne algılama uygulamaları için güçlü Ultralytics YOLO modellerinin eğitilmesini kolaylaştırır.

Ultralytics'e nasıl yeni bir veri kümesi katkıda bulunabilirim?

Yeni bir veri kümesine katkıda bulunmak çeşitli adımlar içerir:

  1. Görüntüleri Toplayın: Genel veritabanlarından veya kişisel koleksiyonlardan görüntüler toplayın.
  2. Görüntüleri Etiketleyin: Göreve bağlı olarak sınırlayıcı kutular, segmentler veya anahtar noktaları uygulayın.
  3. Açıklamaları Dışa Aktar: Açıklamaları YOLO'ya dönüştürün *.txt biçiminde olmalıdır.
  4. Veri Kümesini Düzenleyin: Klasör yapısını şu şekilde kullanın: train/ ve val/ alt dizinler içeren images/ ve labels/ dizinler.
  5. Bir tane oluşturun data.yaml Dosya: Veri kümesi açıklamalarını, sınıfları ve diğer ilgili bilgileri ekleyin.
  6. Görüntüleri Optimize Edin (İsteğe Bağlı): Verimlilik için veri kümesi boyutunu küçültün.
  7. Veri Kümesini Sıkıştırın: Veri kümesini bir zip dosyasına sıkıştırın.
  8. Belgeleyin ve PR Gönderin: Veri kümenizi açıklayın ve Ultralytics Katkı Yönergeleri'ni izleyerek bir Çekme İsteği gönderin.

Kapsamlı bir kılavuz için Yeni Veri Kümelerine Katkıda Bulunun adresini ziyaret edin.

Veri kümem için neden Ultralytics HUB'ı kullanmalıyım?

Ultralytics HUB, aşağıdakiler dahil olmak üzere veri kümesi yönetimi ve analizi için güçlü özellikler sunar:

  • Sorunsuz Veri Kümesi Yönetimi: Veri kümelerinizi tek bir yerden yükleyin, düzenleyin ve yönetin.
  • Anında Eğitim Entegrasyonu: Ek kurulum olmadan model eğitimi için doğrudan yüklenen veri kümelerini kullanın.
  • Görselleştirme Araçları: Veri kümesi resimlerinizi ve açıklamalarınızı keşfedin ve görselleştirin.
  • Veri Kümesi Analizi: Veri kümesi dağılımınız ve özellikleri hakkında bilgi edinin.

Platform, veri kümesi yönetiminden model eğitimine geçişi kolaylaştırarak tüm süreci daha verimli hale getirir. Ultralytics HUB Veri Kümeleri hakkında daha fazla bilgi edinin.

Bilgisayar görüşü için Ultralytics YOLO modellerinin benzersiz özellikleri nelerdir?

Ultralytics YOLO modelleri, bilgisayarla görme görevleri için çeşitli benzersiz özellikler sunar:

  • Gerçek zamanlı Performans: Zamana duyarlı uygulamalar için yüksek hızlı çıkarım ve eğitim yetenekleri.
  • Çok Yönlülük: Birleşik bir çerçevede algılama, segmentasyon, sınıflandırma ve poz tahmini görevleri için destek.
  • Önceden Eğitilmiş Modeller: Çeşitli uygulamalar için yüksek performanslı, önceden eğitilmiş modellere erişim, eğitim süresini kısaltır.
  • Kapsamlı Topluluk Desteği: Sorun giderme ve geliştirme için aktif topluluk ve kapsamlı dokümantasyon.
  • Kolay Entegrasyon: Mevcut projeler ve iş akışlarıyla entegre olmak için basit API.

Ultralytics Modelleri sayfasında YOLO modelleri hakkında daha fazla bilgi edinin.

Ultralytics araçlarını kullanarak bir veri kümesini nasıl optimize edebilir ve sıkıştırabilirim?

Ultralytics araçlarını kullanarak bir veri kümesini optimize etmek ve sıkıştırmak için şu örnek kodu izleyin:

Bir Veri Kümesini Optimize Edin ve Sıkıştırın

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Bu işlem, daha verimli depolama ve daha hızlı indirme hızları için veri kümesi boyutunu küçültmeye yardımcı olur. Nasıl yapılacağını öğrenmek için Bir Veri Kümesini Optimize Etme ve Sıkıştırma konusuna bakın.



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar