Conjunto de Dados DOTA8
Introdução
O Ultralytics DOTA8 é um conjunto de dados pequeno, mas versátil, de detecção de objetos orientados, composto pelas primeiras 8 imagens do conjunto DOTAv1 dividido, 4 para treinamento e 4 para validação. Este conjunto de dados é ideal para testar e depurar modelos de detecção de objetos ou para experimentar novas abordagens de detecção. Com 8 imagens, é pequeno o suficiente para ser facilmente gerenciável, mas diversificado o suficiente para testar pipelines de treinamento em busca de erros e atuar como uma verificação de sanidade antes de treinar conjuntos de dados maiores.
Este conjunto de dados destina-se ao uso com o HUB Ultralytics e YOLO11.
YAML do Conjunto de Dados
Um arquivo YAML (Yet Another Markup Language) é usado para definir a configuração do conjunto de dados. Ele contém informações sobre os caminhos, classes e outras informações relevantes do conjunto de dados. No caso do conjunto de dados DOTA8, o dota8.yaml
arquivo é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
ultralytics/cfg/datasets/dota8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip
Utilização
Para treinar um modelo YOLO11n-obb no conjunto de dados DOTA8 por 100 epochs com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para uma lista completa de argumentos disponíveis, consulte a página de Treinamento do modelo.
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640
Amostras de Imagens e Anotações
Aqui estão alguns exemplos de imagens do conjunto de dados DOTA8, juntamente com suas anotações correspondentes:
- Imagem em Mosaico: Esta imagem demonstra um lote de treinamento composto por imagens de conjunto de dados em mosaico. O mosaico é uma técnica usada durante o treinamento que combina várias imagens em uma única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treinamento. Isso ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.
O exemplo demonstra a variedade e complexidade das imagens no conjunto de dados DOTA8 e os benefícios de usar mosaicos durante o processo de treinamento.
Citações e Agradecimentos
Se você usar o conjunto de dados DOTA em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Uma nota especial de gratidão à equipe por trás dos conjuntos de dados DOTA por seu esforço louvável na curadoria deste conjunto de dados. Para uma compreensão exaustiva do conjunto de dados e suas nuances, visite o site oficial do DOTA.
FAQ
O que é o conjunto de dados DOTA8 e como ele pode ser usado?
O conjunto de dados DOTA8 é um pequeno e versátil conjunto de dados de detecção de objetos orientados, composto pelas primeiras 8 imagens do conjunto dividido DOTAv1, com 4 imagens designadas para treinamento e 4 para validação. É ideal para testar e depurar modelos de detecção de objetos como o Ultralytics YOLO11. Devido ao seu tamanho gerenciável e diversidade, ajuda a identificar erros de pipeline e executar verificações de sanidade antes de implantar conjuntos de dados maiores. Saiba mais sobre a detecção de objetos com Ultralytics YOLO11.
Como faço para treinar um modelo YOLO11 usando o dataset DOTA8?
Para treinar um modelo YOLO11n-obb no conjunto de dados DOTA8 por 100 epochs com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para opções de argumentos abrangentes, consulte a página de Treinamento do modelo.
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640
Quais são as principais características do conjunto de dados DOTA e onde posso acessar o arquivo YAML?
O conjunto de dados DOTA é conhecido por seu benchmark em grande escala e pelos desafios que apresenta para a detecção de objetos em imagens aéreas. O subconjunto DOTA8 é um conjunto de dados menor e gerenciável, ideal para testes iniciais. Você pode acessar o dota8.yaml
ficheiro, que contém caminhos, classes e detalhes de configuração, neste Link do GitHub.
Como o mosaicing aprimora o treinamento do modelo com o conjunto de dados DOTA8?
O mosaico combina várias imagens em uma durante o treinamento, aumentando a variedade de objetos e contextos dentro de cada lote. Isso melhora a capacidade de um modelo de generalizar para diferentes tamanhos de objetos, proporções e cenas. Essa técnica pode ser demonstrada visualmente através de um lote de treinamento composto por imagens do conjunto de dados DOTA8 em mosaico, auxiliando no desenvolvimento de um modelo robusto. Explore mais sobre mosaico e técnicas de treinamento em nossa página de Treinamento.
Por que devo usar Ultralytics YOLO11 para tarefas de detecção de objetos?
Ultralytics YOLO11 oferece recursos de detecção de objetos em tempo real de última geração, incluindo recursos como caixas delimitadoras orientadas (OBB), segmentação de instâncias e um pipeline de treinamento altamente versátil. É adequado para diversas aplicações e oferece modelos pré-treinados para ajuste fino eficiente. Explore mais sobre as vantagens e o uso na documentação do Ultralytics YOLO11.