Conjunto de Dados COCO8-Pose
Introdução
O Ultralytics COCO8-Pose é um conjunto de dados pequeno, mas versátil, de detecção de pose composto pelas 8 primeiras imagens do conjunto de treinamento COCO 2017, 4 para treinamento e 4 para validação. Este conjunto de dados é ideal para testar e depurar modelos de detecção de objetos ou para experimentar novas abordagens de detecção. Com 8 imagens, é pequeno o suficiente para ser facilmente gerenciável, mas diversificado o suficiente para testar pipelines de treinamento em busca de erros e atuar como uma verificação de sanidade antes de treinar conjuntos de dados maiores.
Este conjunto de dados destina-se ao uso com o HUB Ultralytics e YOLO11.
YAML do Conjunto de Dados
Um arquivo YAML (Yet Another Markup Language) é usado para definir a configuração do conjunto de dados. Ele contém informações sobre os caminhos, classes e outras informações relevantes do conjunto de dados. No caso do conjunto de dados COCO8-Pose, o coco8-pose.yaml
arquivo é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml.
ultralytics/cfg/datasets/coco8-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-pose dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/coco8-pose/
# Example usage: yolo train data=coco8-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-pose ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-pose # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]
# Classes
names:
0: person
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-pose.zip
Utilização
Para treinar um modelo YOLO11n-pose no conjunto de dados COCO8-Pose por 100 epochs com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para uma lista completa de argumentos disponíveis, consulte a página de Treinamento do modelo.
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Amostras de Imagens e Anotações
Aqui estão alguns exemplos de imagens do conjunto de dados COCO8-Pose, juntamente com suas anotações correspondentes:
- Imagem em Mosaico: Esta imagem demonstra um lote de treinamento composto por imagens de conjunto de dados em mosaico. O mosaico é uma técnica usada durante o treinamento que combina várias imagens em uma única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treinamento. Isso ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.
O exemplo mostra a variedade e a complexidade das imagens no conjunto de dados COCO8-Pose e os benefícios de usar mosaicos durante o processo de treinamento.
Citações e Agradecimentos
Se você usar o conjunto de dados COCO em seu trabalho de pesquisa ou desenvolvimento, cite o seguinte artigo:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Gostaríamos de agradecer ao COCO Consortium por criar e manter este valioso recurso para a comunidade de visão computacional. Para obter mais informações sobre o conjunto de dados COCO e seus criadores, visite o site do conjunto de dados COCO.
FAQ
O que é o conjunto de dados COCO8-Pose e como ele é usado com o Ultralytics YOLO11?
O conjunto de dados COCO8-Pose é um conjunto de dados de detecção de pose pequeno e versátil que inclui as primeiras 8 imagens do conjunto COCO train 2017, com 4 imagens para treinamento e 4 para validação. Ele foi projetado para testar e depurar modelos de detecção de objetos e experimentar novas abordagens de detecção. Este conjunto de dados é ideal para experimentos rápidos com Ultralytics YOLO11. Para mais detalhes sobre a configuração do conjunto de dados, consulte o arquivo YAML do conjunto de dados.
Como faço para treinar um modelo YOLO11 usando o dataset COCO8-Pose no Ultralytics?
Para treinar um modelo YOLO11n-pose no conjunto de dados COCO8-Pose por 100 epochs com um tamanho de imagem de 640, siga estes exemplos:
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt")
# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Para uma lista completa de argumentos de treinamento, consulte a página de Treinamento do modelo.
Quais são os benefícios de usar o conjunto de dados COCO8-Pose?
O conjunto de dados COCO8-Pose oferece vários benefícios:
- Tamanho Compacto: Com apenas 8 imagens, é fácil de gerenciar e perfeito para experimentos rápidos.
- Dados Diversos: Apesar de seu tamanho pequeno, inclui uma variedade de cenas, útil para testes completos de pipeline.
- Depuração de Erros: Ideal para identificar erros de treinamento e realizar verificações de integridade antes de escalar para conjuntos de dados maiores.
Para mais informações sobre os seus recursos e utilização, consulte a seção Introdução ao Dataset.
Como o mosaicing beneficia o processo de treinamento do YOLO11 usando o conjunto de dados COCO8-Pose?
O mosaico, demonstrado nas sample_images do conjunto de dados COCO8-Pose, combina várias imagens em uma, aumentando a variedade de objetos e cenas dentro de cada lote de treinamento. Essa técnica ajuda a melhorar a capacidade do modelo de generalizar em vários tamanhos de objetos, proporções e contextos, aprimorando, em última análise, o desempenho do modelo. Consulte a seção Sample Images and Annotations para example images.
Onde posso encontrar o arquivo YAML do conjunto de dados COCO8-Pose e como usá-lo?
O arquivo YAML do conjunto de dados COCO8-Pose pode ser encontrado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml. Este arquivo define a configuração do conjunto de dados, incluindo caminhos, classes e outras informações relevantes. Use este arquivo com os scripts de treinamento YOLO11, conforme mencionado na seção Train Example.
Para mais perguntas frequentes e documentação detalhada, visite a Documentação Ultralytics.