Ir para o conteúdo

Conjunto de Dados COCO8-Pose

Introdução

O Ultralytics COCO8-Pose é um conjunto de dados pequeno, mas versátil, de detecção de pose composto pelas 8 primeiras imagens do conjunto de treinamento COCO 2017, 4 para treinamento e 4 para validação. Este conjunto de dados é ideal para testar e depurar modelos de detecção de objetos ou para experimentar novas abordagens de detecção. Com 8 imagens, é pequeno o suficiente para ser facilmente gerenciável, mas diversificado o suficiente para testar pipelines de treinamento em busca de erros e atuar como uma verificação de sanidade antes de treinar conjuntos de dados maiores.

Este conjunto de dados destina-se ao uso com o HUB Ultralytics e YOLO11.

YAML do Conjunto de Dados

Um arquivo YAML (Yet Another Markup Language) é usado para definir a configuração do conjunto de dados. Ele contém informações sobre os caminhos, classes e outras informações relevantes do conjunto de dados. No caso do conjunto de dados COCO8-Pose, o coco8-pose.yaml arquivo é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml.

ultralytics/cfg/datasets/coco8-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8-pose dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/coco8-pose/
# Example usage: yolo train data=coco8-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8-pose ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-pose # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]

# Classes
names:
  0: person

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-pose.zip

Utilização

Para treinar um modelo YOLO11n-pose no conjunto de dados COCO8-Pose por 100 epochs com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para uma lista completa de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Amostras de Imagens e Anotações

Aqui estão alguns exemplos de imagens do conjunto de dados COCO8-Pose, juntamente com suas anotações correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em Mosaico: Esta imagem demonstra um lote de treinamento composto por imagens de conjunto de dados em mosaico. O mosaico é uma técnica usada durante o treinamento que combina várias imagens em uma única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treinamento. Isso ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.

O exemplo mostra a variedade e a complexidade das imagens no conjunto de dados COCO8-Pose e os benefícios de usar mosaicos durante o processo de treinamento.

Citações e Agradecimentos

Se você usar o conjunto de dados COCO em seu trabalho de pesquisa ou desenvolvimento, cite o seguinte artigo:

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Gostaríamos de agradecer ao COCO Consortium por criar e manter este valioso recurso para a comunidade de visão computacional. Para obter mais informações sobre o conjunto de dados COCO e seus criadores, visite o site do conjunto de dados COCO.

FAQ

O que é o conjunto de dados COCO8-Pose e como ele é usado com o Ultralytics YOLO11?

O conjunto de dados COCO8-Pose é um conjunto de dados de detecção de pose pequeno e versátil que inclui as primeiras 8 imagens do conjunto COCO train 2017, com 4 imagens para treinamento e 4 para validação. Ele foi projetado para testar e depurar modelos de detecção de objetos e experimentar novas abordagens de detecção. Este conjunto de dados é ideal para experimentos rápidos com Ultralytics YOLO11. Para mais detalhes sobre a configuração do conjunto de dados, consulte o arquivo YAML do conjunto de dados.

Como faço para treinar um modelo YOLO11 usando o dataset COCO8-Pose no Ultralytics?

Para treinar um modelo YOLO11n-pose no conjunto de dados COCO8-Pose por 100 epochs com um tamanho de imagem de 640, siga estes exemplos:

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="coco8-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=coco8-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Para uma lista completa de argumentos de treinamento, consulte a página de Treinamento do modelo.

Quais são os benefícios de usar o conjunto de dados COCO8-Pose?

O conjunto de dados COCO8-Pose oferece vários benefícios:

  • Tamanho Compacto: Com apenas 8 imagens, é fácil de gerenciar e perfeito para experimentos rápidos.
  • Dados Diversos: Apesar de seu tamanho pequeno, inclui uma variedade de cenas, útil para testes completos de pipeline.
  • Depuração de Erros: Ideal para identificar erros de treinamento e realizar verificações de integridade antes de escalar para conjuntos de dados maiores.

Para mais informações sobre os seus recursos e utilização, consulte a seção Introdução ao Dataset.

Como o mosaicing beneficia o processo de treinamento do YOLO11 usando o conjunto de dados COCO8-Pose?

O mosaico, demonstrado nas sample_images do conjunto de dados COCO8-Pose, combina várias imagens em uma, aumentando a variedade de objetos e cenas dentro de cada lote de treinamento. Essa técnica ajuda a melhorar a capacidade do modelo de generalizar em vários tamanhos de objetos, proporções e contextos, aprimorando, em última análise, o desempenho do modelo. Consulte a seção Sample Images and Annotations para example images.

Onde posso encontrar o arquivo YAML do conjunto de dados COCO8-Pose e como usá-lo?

O arquivo YAML do conjunto de dados COCO8-Pose pode ser encontrado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco8-pose.yaml. Este arquivo define a configuração do conjunto de dados, incluindo caminhos, classes e outras informações relevantes. Use este arquivo com os scripts de treinamento YOLO11, conforme mencionado na seção Train Example.

Para mais perguntas frequentes e documentação detalhada, visite a Documentação Ultralytics.



📅 Criado há 1 ano ✏️ Atualizado há 3 meses

Comentários