COCO8-Çok Spektralli Veri Kümesi
Giriş
Ultralytics COCO8-Çok Spektralli veri kümesi, çok spektralli nesne algılama modelleriyle denemeyi kolaylaştırmak için tasarlanmış, orijinal COCO8 veri kümesinin gelişmiş bir çeşididir. COCO train 2017 setindeki aynı 8 görüntüden (4'ü eğitim ve 4'ü doğrulama için) oluşur, ancak her görüntü 10 kanallı çok spektralli bir formata dönüştürülmüştür. Standart RGB kanallarının ötesine geçerek, COCO8-Çok Spektralli, daha zengin spektral bilgilerden yararlanabilen modellerin geliştirilmesini ve değerlendirilmesini sağlar.
COCO8-Çok Spektralli, Ultralytics HUB ve YOLO11 ile tamamen uyumludur ve bilgisayar görüşü iş akışlarınıza sorunsuz entegrasyon sağlar.
Veri Kümesi Oluşturma
COCO8-Multispectral'deki çok spektralli görüntüler, orijinal RGB görüntülerinin görünür spektrum içindeki eşit aralıklı 10 spektral kanal boyunca enterpolasyonuyla oluşturulmuştur. Süreç şunları içerir:
- Dalga Boyu Ataması: RGB kanallarına nominal dalga boyları atama—Kırmızı: 650 nm, Yeşil: 510 nm, Mavi: 475 nm.
- Enterpolasyon: 450 nm ile 700 nm arasındaki ara dalga boylarında piksel değerlerini tahmin etmek için doğrusal enterpolasyon kullanılarak 10 spektral kanal elde edilir.
- Ekstrapolasyon: SciPy'nin ile ekstrapolasyon uygulama
interp1d
işlevi, orijinal RGB dalga boylarının ötesindeki değerleri tahmin ederek eksiksiz bir spektral gösterim sağlar.
Bu yaklaşım, çok spektralli bir görüntüleme sürecini simüle ederek model eğitimi ve değerlendirmesi için daha çeşitli bir veri kümesi sağlar. Çok spektralli görüntüleme hakkında daha fazla bilgi için Çok Spektralli Görüntüleme Wikipedia makalesine bakın.
Veri Seti YAML
COCO8-Multispectral veri kümesi, veri kümesi yollarını, sınıf adlarını ve temel meta verileri tanımlayan bir YAML dosyası kullanılarak yapılandırılır. Resmi olanı inceleyebilirsiniz coco8-multispectral.yaml
dosyası içinde Ultralytics GitHub deposunu.
ultralytics/cfg/datasets/coco8-multispectral.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-Multispectral dataset (COCO8 images interpolated across 10 channels in the visual spectrum) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8-multispectral/
# Example usage: yolo train data=coco8-multispectral.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-multispectral ← downloads here (20.2 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-multispectral # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Number of multispectral image channels
channels: 10
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-multispectral.zip
Not
TIFF görüntülerinizi şunun içinde hazırlayın: (channel, height, width)
sırayla ve şu şekilde kaydedilir .tiff
veya .tif
Ultralytics ile kullanım için uzantı:
import cv2
import numpy as np
# Create and write 10-channel TIFF
image = np.ones((10, 640, 640), dtype=np.uint8) # CHW-order
cv2.imwritemulti("example.tiff", image)
# Read TIFF
success, frames_list = cv2.imreadmulti("example.tiff")
image = np.stack(frames_list, axis=2)
print(image.shape) # (640, 640, 10) HWC-order for training and inference
Kullanım
640 görüntü boyutuyla 100 epok için COCO8-Multispectral veri kümesinde bir YOLO11n modeli eğitmek için aşağıdaki örnekleri kullanın. Eğitim seçeneklerinin kapsamlı bir listesi için YOLO Eğitim belgelerine bakın.
Eğitim Örneği
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on COCO8-Multispectral
results = model.train(data="coco8-multispectral.yaml", epochs=100, imgsz=640)
# Train YOLO11n on COCO8-Multispectral using the command line
yolo detect train data=coco8-multispectral.yaml model=yolo11n.pt epochs=100 imgsz=640
Model seçimi ve en iyi uygulamalar hakkında daha fazla bilgi için Ultralytics YOLO model dökümanlarını ve YOLO Model Eğitim İpuçları kılavuzunu inceleyin.
Örnek Görüntüler ve Açıklamalar
Aşağıda, COCO8-Multispectral veri kümesinden mozaiklenmiş bir eğitim grubuna bir örnek verilmiştir:
- Mozaiklenmiş Görüntü: Bu görüntü, mozaik artırma kullanılarak birden çok veri kümesi görüntüsünün birleştirildiği bir eğitim grubunu göstermektedir. Mozaik artırma, her gruptaki nesnelerin ve sahnelerin çeşitliliğini artırarak modelin çeşitli nesne boyutlarına, en boy oranlarına ve arka planlara daha iyi genellemesine yardımcı olur.
Bu teknik, eğitim sırasında her görüntünün faydasını en üst düzeye çıkardığı için COCO8-Multispectral gibi küçük veri kümeleri için özellikle değerlidir.
Alıntılar ve Teşekkürler
Araştırmanızda veya geliştirmenizde COCO veri kümesini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Bilgisayar görüşü topluluğuna devam eden katkılarından dolayı COCO Consortium'a özel teşekkürler.
SSS
Ultralytics COCO8-Çok Spektralli Veri Kümesi Ne İçin Kullanılır?
Ultralytics COCO8-Multispectral veri seti, çok spektralli nesne algılama modellerinin hızlı bir şekilde test edilmesi ve hatalarının ayıklanması için tasarlanmıştır. Sadece 8 görüntü (4'ü eğitim, 4'ü doğrulama için) ile YOLO eğitim ardışık düzenlerinizi doğrulamak ve daha büyük veri kümelerine ölçeklendirmeden önce her şeyin beklendiği gibi çalıştığından emin olmak için idealdir. Deney yapabileceğiniz daha fazla veri seti için Ultralytics Veri Setleri Kataloğu'nu ziyaret edin.
Çok Spektral Veriler Nesne Algılamayı Nasıl Geliştirir?
Çok spektralli veriler, standart RGB'nin ötesinde ek spektral bilgiler sağlayarak modellerin nesneleri dalga boyları genelindeki yansıtmadaki ince farklılıklara göre ayırt etmesini sağlar. Bu, özellikle zorlu senaryolarda algılama doğruluğunu artırabilir. Çok spektralli görüntüleme ve gelişmiş bilgisayar görüşü alanındaki uygulamaları hakkında daha fazla bilgi edinin.
COCO8-Multispectral, Ultralytics HUB ve YOLO Modelleriyle Uyumlu mu?
Evet, COCO8-Multispectral, en son YOLO11 dahil olmak üzere Ultralytics HUB ve tüm YOLO modelleri ile tamamen uyumludur. Bu, veri kümesini eğitim ve doğrulama iş akışlarınıza kolayca entegre etmenizi sağlar.
Veri Artırma Teknikleri Hakkında Daha Fazla Bilgiyi Nerede Bulabilirim?
Mozaik gibi veri artırma yöntemleri ve bunların model performansı üzerindeki etkileri hakkında daha derin bir anlayış için YOLO Veri Artırma Kılavuzu'na ve Ultralytics'in Veri Artırma hakkındaki Bloguna bakın.
COCO8-Multispectral'i Kıyaslama veya Eğitim Amaçları İçin Kullanabilir miyim?
Kesinlikle! COCO8-Multispectral'in küçük boyutu ve çok spektralli yapısı, onu kıyaslama, eğitim gösterileri ve yeni model mimarileri prototipleme için ideal hale getirir. Daha fazla kıyaslama veri kümesi için Ultralytics Kıyaslama Veri Kümesi Koleksiyonu'na bakın.