Ir para o conteúdo

Conjunto de dados Tiger-Pose

Introdução

A Ultralytics apresenta o conjunto de dados Tiger-Pose, uma coleção versátil projetada para tarefas de estimativa de pose. Este conjunto de dados compreende 263 imagens provenientes de um Vídeo do YouTube, com 210 imagens alocadas para treinamento e 53 para validação. Ele serve como um excelente recurso para testar e solucionar problemas de algoritmos de estimativa de pose.

Apesar de seu tamanho gerenciável de 210 imagens, o conjunto de dados Tiger-Pose oferece diversidade, tornando-o adequado para avaliar pipelines de treinamento, identificar erros potenciais e servir como uma etapa preliminar valiosa antes de trabalhar com conjuntos de dados maiores para estimação de pose.

Este conjunto de dados destina-se ao uso com Ultralytics HUB e YOLO11.



Assista: Treine o Modelo de Pose YOLO11 no Conjunto de Dados Tiger-Pose Usando o Ultralytics HUB

YAML do Conjunto de Dados

Um arquivo YAML (Yet Another Markup Language) serve como meio de especificar os detalhes de configuração de um conjunto de dados. Ele engloba dados cruciais, como caminhos de arquivos, definições de classe e outras informações pertinentes. Especificamente, para o tiger-pose.yaml ficheiro, pode verificar Arquivo de Configuração do Conjunto de Dados Ultralytics Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Utilização

Para treinar um modelo YOLO11n-pose no conjunto de dados Tiger-Pose por 100 épocas com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para uma lista completa de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Amostras de Imagens e Anotações

Aqui estão alguns exemplos de imagens do conjunto de dados Tiger-Pose, juntamente com suas anotações correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em Mosaico: Esta imagem demonstra um lote de treinamento composto por imagens de conjunto de dados em mosaico. O mosaico é uma técnica usada durante o treinamento que combina várias imagens em uma única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treinamento. Isso ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.

O exemplo mostra a variedade e a complexidade das imagens no conjunto de dados Tiger-Pose e os benefícios de usar mosaicos durante o processo de treinamento.

Exemplo de Inferência

Exemplo de Inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Citações e Agradecimentos

O conjunto de dados foi lançado e está disponível sob a Licença AGPL-3.0.

FAQ

Para que serve o conjunto de dados Ultralytics Tiger-Pose?

O conjunto de dados Ultralytics Tiger-Pose foi projetado para tarefas de estimativa de pose, consistindo em 263 imagens provenientes de um vídeo do YouTube. O conjunto de dados é dividido em 210 imagens de treinamento e 53 imagens de validação. É particularmente útil para testar, treinar e refinar algoritmos de estimativa de pose usando Ultralytics HUB e YOLO11.

Como faço para treinar um modelo YOLO11 no dataset Tiger-Pose?

Para treinar um modelo YOLO11n-pose no conjunto de dados Tiger-Pose por 100 épocas com um tamanho de imagem de 640, use os seguintes trechos de código. Para mais detalhes, visite a página de Treinamento:

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Quais configurações o tiger-pose.yaml ficheiro incluir?

O tiger-pose.yaml ficheiro é usado para especificar os detalhes de configuração do conjunto de dados Tiger-Pose. Inclui dados cruciais, como caminhos de ficheiro e definições de classe. Para ver a configuração exata, pode consultar o Arquivo de Configuração do Conjunto de Dados Ultralytics Tiger-Pose.

Como posso executar a inferência usando um modelo YOLO11 treinado no conjunto de dados Tiger-Pose?

Para realizar a inferência usando um modelo YOLO11 treinado no conjunto de dados Tiger-Pose, você pode usar os seguintes trechos de código. Para um guia detalhado, visite a página de Predição:

Exemplo de Inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Quais são os benefícios de usar o conjunto de dados Tiger-Pose para estimativa de pose?

O conjunto de dados Tiger-Pose, apesar de seu tamanho gerenciável de 210 imagens para treinamento, fornece uma coleção diversificada de imagens que são ideais para testar pipelines de estimativa de pose. O conjunto de dados ajuda a identificar erros potenciais e atua como uma etapa preliminar antes de trabalhar com conjuntos de dados maiores. Além disso, o conjunto de dados suporta o treinamento e o refinamento de algoritmos de estimativa de pose usando ferramentas avançadas como Ultralytics HUB e YOLO11, melhorando o desempenho e a precisão.



📅 Criado há 1 ano ✏️ Atualizado há 4 meses

Comentários