Ir para o conteúdo

Conjunto de Dados CIFAR-100

O CIFAR-100 (Canadian Institute For Advanced Research) é uma extensão significativa do conjunto de dados CIFAR-10, composto por 60.000 imagens coloridas de 32x32 em 100 classes diferentes. Foi desenvolvido por pesquisadores do instituto CIFAR, oferecendo um conjunto de dados mais desafiador para tarefas mais complexas de aprendizado de máquina e visão computacional.



Assista: Como Treinar Ultralytics YOLO11 no CIFAR-100 | Tutorial Passo a Passo de Classificação de Imagens 🚀

Principais Características

  • O conjunto de dados CIFAR-100 consiste em 60.000 imagens, divididas em 100 classes.
  • Cada classe contém 600 imagens, divididas em 500 para treinamento e 100 para teste.
  • As imagens são coloridas e têm tamanho de 32x32 pixels.
  • As 100 classes diferentes são agrupadas em 20 categorias amplas para classificação de nível superior.
  • CIFAR-100 é comumente usado para treinamento e teste no campo de aprendizado de máquina e visão computacional.

Estrutura do Conjunto de Dados

O conjunto de dados CIFAR-100 é dividido em dois subconjuntos:

  1. Conjunto de Treino: Este subconjunto contém 50.000 imagens usadas para treinar modelos de machine learning.
  2. Conjunto de Teste: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.

Aplicações

O dataset CIFAR-100 é extensivamente usado para treinar e avaliar modelos de aprendizado profundo em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizado de máquina. A diversidade do dataset em termos de classes e a presença de imagens coloridas o tornam um dataset mais desafiador e abrangente para pesquisa e desenvolvimento no campo de aprendizado de máquina e visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados CIFAR-100 por 100 épocas com um tamanho de imagem de 32x32, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Amostras de Imagens e Anotações

O dataset CIFAR-100 contém imagens coloridas de vários objetos, fornecendo um dataset bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do dataset:

Imagem de amostra do conjunto de dados

O exemplo demonstra a variedade e complexidade dos objetos no conjunto de dados CIFAR-100, destacando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.

Citações e Agradecimentos

Se você usar o conjunto de dados CIFAR-100 em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o conjunto de dados CIFAR-100 como um recurso valioso para a comunidade de pesquisa em aprendizado de máquina e visão computacional. Para mais informações sobre o conjunto de dados CIFAR-100 e seu criador, visite o site do conjunto de dados CIFAR-100.

FAQ

O que é o conjunto de dados CIFAR-100 e por que ele é significativo?

O conjunto de dados CIFAR-100 é uma grande coleção de 60.000 imagens coloridas de 32x32 classificadas em 100 classes. Desenvolvido pelo Canadian Institute For Advanced Research (CIFAR), ele fornece um conjunto de dados desafiador ideal para tarefas complexas de aprendizado de máquina e visão computacional. A sua importância reside na diversidade de classes e no pequeno tamanho das imagens, tornando-o um recurso valioso para treinar e testar modelos de aprendizado profundo, como Redes Neurais Convolucionais (CNNs), usando frameworks como o Ultralytics YOLO.

Como faço para treinar um modelo YOLO no dataset CIFAR-100?

Pode treinar um modelo YOLO no conjunto de dados CIFAR-100 usando comandos Python ou CLI. Veja como:

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Para uma lista completa dos argumentos disponíveis, consulte a página de Treinamento do modelo.

Quais são as principais aplicações do conjunto de dados CIFAR-100?

O dataset CIFAR-100 é amplamente utilizado no treinamento e avaliação de modelos de aprendizado profundo para classificação de imagens. Seu conjunto diversificado de 100 classes, agrupadas em 20 categorias amplas, fornece um ambiente desafiador para testar algoritmos como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e várias outras abordagens de aprendizado de máquina. Este dataset é um recurso fundamental em pesquisa e desenvolvimento dentro dos campos de aprendizado de máquina e visão computacional, particularmente para tarefas de reconhecimento de objetos e classificação.

Como o conjunto de dados CIFAR-100 é estruturado?

O conjunto de dados CIFAR-100 é dividido em dois subconjuntos principais:

  1. Conjunto de Treino: Contém 50.000 imagens usadas para treinar modelos de machine learning.
  2. Conjunto de Teste: Consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.

Cada uma das 100 classes contém 600 imagens, com 500 imagens para treinamento e 100 para teste, tornando-o exclusivamente adequado para pesquisa acadêmica e industrial rigorosa.

Onde posso encontrar imagens de amostra e anotações do conjunto de dados CIFAR-100?

O dataset CIFAR-100 inclui uma variedade de imagens coloridas de vários objetos, tornando-o um dataset estruturado para tarefas de classificação de imagens. Você pode consultar a página de documentação para ver sample_images e anotações. Esses exemplos destacam a diversidade e a complexidade do dataset, importantes para treinar modelos robustos de classificação de imagens. Para mais datasets adequados para tarefas de classificação, confira a visão geral dos datasets de classificação da Ultralytics.



📅 Criado há 1 ano ✏️ Atualizado há 4 meses

Comentários