Conjunto de Dados CIFAR-10
O conjunto de dados CIFAR-10 (Canadian Institute For Advanced Research) é uma coleção de imagens amplamente utilizada para algoritmos de aprendizado de máquina e visão computacional. Foi desenvolvido por pesquisadores do instituto CIFAR e consiste em 60.000 imagens coloridas de 32x32 em 10 classes diferentes.
Assista: Como Treinar um Classificação de Imagem Modelo com o Conjunto de Dados CIFAR-10 usando Ultralytics YOLO11
Principais Características
- O conjunto de dados CIFAR-10 consiste em 60.000 imagens, divididas em 10 classes.
- Cada classe contém 6.000 imagens, divididas em 5.000 para treinamento e 1.000 para teste.
- As imagens são coloridas e têm tamanho de 32x32 pixels.
- As 10 classes diferentes representam aviões, carros, pássaros, gatos, veados, cachorros, sapos, cavalos, navios e caminhões.
- O CIFAR-10 é comumente usado para treinamento e teste no campo de aprendizado de máquina e visão computacional.
Estrutura do Conjunto de Dados
O conjunto de dados CIFAR-10 é dividido em dois subconjuntos:
- Conjunto de Treino: Este subconjunto contém 50.000 imagens usadas para treinar modelos de machine learning.
- Conjunto de Teste: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.
Aplicações
O dataset CIFAR-10 é amplamente utilizado para treinar e avaliar modelos de aprendizado profundo em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizado de máquina. A diversidade do dataset em termos de classes e a presença de imagens coloridas o tornam um dataset completo para pesquisa e desenvolvimento no campo de aprendizado de máquina e visão computacional.
Utilização
Para treinar um modelo YOLO no conjunto de dados CIFAR-10 por 100 épocas com um tamanho de imagem de 32x32, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
Amostras de Imagens e Anotações
O conjunto de dados CIFAR-10 contém imagens coloridas de vários objetos, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:
O exemplo demonstra a variedade e complexidade dos objetos no conjunto de dados CIFAR-10, destacando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.
Citações e Agradecimentos
Se você usar o conjunto de dados CIFAR-10 em seu trabalho de pesquisa ou desenvolvimento, cite o seguinte artigo:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Gostaríamos de agradecer a Alex Krizhevsky por criar e manter o conjunto de dados CIFAR-10 como um recurso valioso para a comunidade de pesquisa de machine learning e visão computacional. Para obter mais informações sobre o conjunto de dados CIFAR-10 e seu criador, visite o site do conjunto de dados CIFAR-10.
FAQ
Como posso treinar um modelo YOLO no conjunto de dados CIFAR-10?
Para treinar um modelo YOLO no conjunto de dados CIFAR-10 usando Ultralytics, você pode seguir os exemplos fornecidos para Python e CLI. Aqui está um exemplo básico para treinar seu modelo por 100 épocas com um tamanho de imagem de 32x32 pixels:
Exemplo
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
Para mais detalhes, consulte a página de Treinamento do modelo.
Quais são os principais recursos do conjunto de dados CIFAR-10?
O conjunto de dados CIFAR-10 consiste em 60.000 imagens coloridas divididas em 10 classes. Cada classe contém 6.000 imagens, com 5.000 para treinamento e 1.000 para teste. As imagens têm um tamanho de 32x32 pixels e variam nas seguintes categorias:
- Aviões
- Carros
- Pássaros
- Gatos
- Veados
- Cães
- Rãs
- Cavalos
- Navios
- Caminhões
Este conjunto de dados diversificado é essencial para treinar modelos de classificação de imagens em campos como machine learning e visão computacional. Para obter mais informações, visite as seções do CIFAR-10 sobre estrutura do conjunto de dados e aplicações.
Por que usar o conjunto de dados CIFAR-10 para tarefas de classificação de imagens?
O conjunto de dados CIFAR-10 é um excelente benchmark para classificação de imagens devido à sua diversidade e estrutura. Ele contém uma mistura equilibrada de 60.000 imagens rotuladas em 10 categorias diferentes, o que ajuda no treinamento de modelos robustos e generalizados. É amplamente utilizado para avaliar modelos de deep learning, incluindo Redes Neurais Convolucionais (CNNs) e outros algoritmos de machine learning. O conjunto de dados é relativamente pequeno, tornando-o adequado para experimentação rápida e desenvolvimento de algoritmos. Explore suas inúmeras aplicações na seção de aplicações.
Como o conjunto de dados CIFAR-10 é estruturado?
O conjunto de dados CIFAR-10 é estruturado em dois subconjuntos principais:
- Conjunto de Treino: Contém 50.000 imagens usadas para treinar modelos de machine learning.
- Conjunto de Teste: Consiste em 10.000 imagens para testar e avaliar os modelos treinados.
Cada subconjunto compreende imagens categorizadas em 10 classes, com suas anotações prontamente disponíveis para treinamento e avaliação do modelo. Para obter informações mais detalhadas, consulte a seção de estrutura do conjunto de dados.
Como posso citar o conjunto de dados CIFAR-10 em minha pesquisa?
Se você usar o conjunto de dados CIFAR-10 em seus projetos de pesquisa ou desenvolvimento, certifique-se de citar o seguinte artigo:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Reconhecer os criadores do conjunto de dados ajuda a apoiar a pesquisa e o desenvolvimento contínuos na área. Para obter mais detalhes, consulte a seção de citações e agradecimentos.
Quais são alguns exemplos práticos de uso do conjunto de dados CIFAR-10?
O dataset CIFAR-10 é frequentemente usado para treinar modelos de classificação de imagens, como Redes Neurais Convolucionais (CNNs) e Máquinas de Vetores de Suporte (SVMs). Esses modelos podem ser empregados em várias tarefas de visão computacional, incluindo detecção de objetos, reconhecimento de imagem e marcação automatizada. Para ver alguns exemplos práticos, verifique os trechos de código na seção de uso.