İçeriğe geç

Köpek-Pozu Veri Kümesi

Giriş

Ultralytics Köpek-pozu veri kümesi, özellikle köpek anahtar nokta tahmini için özel olarak hazırlanmış yüksek kaliteli ve kapsamlı bir veri kümesidir. 6.773 eğitim görüntüsü ve 1.703 test görüntüsü ile bu veri kümesi, sağlam poz tahmini modelleri eğitmek için sağlam bir temel sağlar.



İzle: Stanford Köpek Poz Tahmini Veri Kümesi üzerinde Ultralytics YOLO11 Nasıl Eğitilir | Adım Adım Eğitim 🚀

Her bir etiketlenmiş görüntü, anahtar nokta başına 3 boyutlu (x, y, görünürlük) 24 anahtar nokta içerir ve bu da onu bilgisayar görüşünde ileri düzey araştırma ve geliştirme için değerli bir kaynak haline getirir.

Ultralytics Köpek-pozisyonu görüntüleme resmi

Bu veri kümesi, Ultralytics HUB ve YOLO11 ile kullanılmak üzere tasarlanmıştır.

Veri Seti YAML

Bir YAML (Yet Another Markup Language) dosyası, veri kümesi yapılandırmasını tanımlamak için kullanılır. Yollar, anahtar nokta ayrıntıları ve diğer ilgili bilgileri içerir. Köpek pozu veri kümesi söz konusu olduğunda, dog-pose.yaml adresinde mevcuttur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Kullanım

640 görüntü boyutuyla 100 epoch için Dog-pose veri kümesinde bir YOLO11n-pose modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Mevcut argümanların kapsamlı bir listesi için model Eğitim sayfasına bakın.

Eğitim Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Örnek Görüntüler ve Açıklamalar

İşte Dog-pose veri kümesinden bazı resim örnekleri ve bunlara karşılık gelen açıklamalar:

Veri kümesi örnek görüntüsü

  • Mozaiklenmiş Görüntü: Bu görüntü, mozaiklenmiş veri seti görüntülerinden oluşan bir eğitim grubunu göstermektedir. Mozaikleme, her eğitim grubundaki nesnelerin ve sahnelerin çeşitliliğini artırmak için birden çok görüntüyü tek bir görüntüde birleştiren eğitim sırasında kullanılan bir tekniktir. Bu, modelin farklı nesne boyutlarına, en boy oranlarına ve bağlamlara genelleme yeteneğini geliştirmeye yardımcı olur.

Bu örnek, Dog-pose veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını ve eğitim sürecinde mozaiklemenin kullanımının faydalarını sergilemektedir.

Alıntılar ve Teşekkürler

Araştırma veya geliştirme çalışmalarınızda Dog-pose veri kümesini kullanırsanız, lütfen aşağıdaki makaleye atıfta bulunun:

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Bilgisayar görüşü topluluğu için bu değerli kaynağı oluşturup sürdürdükleri için Stanford ekibine teşekkür ederiz. Dog-pose veri seti ve yaratıcıları hakkında daha fazla bilgi için Stanford Dogs Veri Seti web sitesini ziyaret edin.

SSS

Dog-pose veri seti nedir ve Ultralytics YOLO11 ile nasıl kullanılır?

Dog-Pose veri kümesi, köpek poz tahmini için 24 anahtar noktayla açıklanmış 6.773 eğitim ve 1.703 test görüntüsü içerir. Ultralytics YOLO11 ile modelleri eğitmek ve doğrulamak için tasarlanmıştır; hayvan davranış analizi, evcil hayvan takibi ve veterinerlik çalışmaları gibi uygulamaları destekler. Veri kümesinin kapsamlı açıklamaları, köpekler için doğru poz tahmini modelleri geliştirmek için idealdir.

Ultralytics'te Köpek-pozu veri kümesini kullanarak bir YOLO11 modeli nasıl eğitirim?

640 görüntü boyutuyla 100 epoch için Dog-pose veri kümesinde bir YOLO11n-pose modeli eğitmek için şu örnekleri izleyin:

Eğitim Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Eğitim argümanlarının kapsamlı bir listesi için model Eğitim sayfasına bakın.

Dog-pose veri kümesini kullanmanın faydaları nelerdir?

Dog-pose veri seti çeşitli avantajlar sunar:

Geniş ve Çeşitli Veri Kümesi: 8.400'den fazla görüntüyle, çok çeşitli köpek pozları, cinsleri ve bağlamlarını kapsayan önemli veriler sağlayarak sağlam model eğitimi ve değerlendirmesi sağlar.

Detaylı Anahtar Nokta Açıklamaları: Her görüntü, anahtar nokta başına 3 boyutlu (x, y, görünürlük) 24 anahtar nokta içerir ve doğru poz algılama modellerini eğitmek için hassas açıklamalar sunar.

Gerçek Dünya Senaryoları: Modelin evcil hayvan izleme ve davranış analizi gibi gerçek dünya uygulamalarına genelleme yeteneğini geliştiren, çeşitli ortamlardan görüntüleri içerir.

Transfer Öğrenimi Avantajı: Veri kümesi transfer öğrenimi teknikleriyle iyi çalışır ve insan pozu veri kümelerinde önceden eğitilmiş modellerin köpeğe özgü özelliklere uyum sağlamasına olanak tanır.

Özellikleri ve kullanımı hakkında daha fazla bilgi için Veri Kümesi Tanıtımı bölümüne bakın.

Dog-pose veri kümesini kullanarak mozaiklemenin YOLO11 eğitim sürecine faydası nedir?

Dog-pose veri setinden alınan sample_images'lerde gösterildiği gibi mozaikleme, birden fazla görüntüyü tek bir kompozitte birleştirerek her eğitim grubundaki nesne ve sahne çeşitliliğini zenginleştirir. Bu teknik çeşitli avantajlar sunar:

  • Her bir partideki köpek pozları, boyutları ve arka plan çeşitliliğini artırır.
  • Modelin farklı bağlamlarda ve ölçeklerde köpekleri algılama yeteneğini geliştirir
  • Modeli daha çeşitli görsel desenlere maruz bırakarak genellemeyi geliştirir
  • Eğitim örneklerinin yeni kombinasyonlarını oluşturarak aşırı öğrenmeyi azaltır

Bu yaklaşım, gerçek dünya senaryolarında daha iyi performans gösteren daha sağlam modellere yol açar. Örnek resimler için Örnek Resimler ve Açıklamalar bölümüne bakın.

Dog-pose veri kümesi YAML dosyasını nerede bulabilirim ve nasıl kullanırım?

Dog-pose veri seti YAML dosyası şu adreste bulunabilir: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Bu dosya, yollar, sınıflar, anahtar nokta ayrıntıları ve diğer ilgili bilgiler dahil olmak üzere veri seti yapılandırmasını tanımlar. YAML, anahtar nokta başına 3 boyutlu 24 anahtar nokta belirtir, bu da onu ayrıntılı poz tahmini görevleri için uygun hale getirir.

Bu dosyayı YOLO11 eğitim komut dosyalarıyla kullanmak için, Kullanım bölümünde gösterildiği gibi eğitim komutunuzda ona başvurmanız yeterlidir. Veri kümesi ilk kullanıldığında otomatik olarak indirilecek ve kurulumu kolaylaştıracaktır.

Daha fazla SSS ve ayrıntılı dokümantasyon için Ultralytics Dokümantasyonunu ziyaret edin.



📅 8 ay önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar