Conjunto de Dados MNIST
O conjunto de dados MNIST (Modified National Institute of Standards and Technology) é um grande banco de dados de dígitos manuscritos que é comumente usado para treinar vários sistemas de processamento de imagem e modelos de aprendizado de máquina. Foi criado "remisturando" as amostras dos conjuntos de dados originais do NIST e tornou-se um benchmark para avaliar o desempenho de algoritmos de classificação de imagens.
Principais Características
- O MNIST contém 60.000 imagens de treinamento e 10.000 imagens de teste de dígitos manuscritos.
- O dataset compreende imagens em escala de cinza de tamanho 28×28 pixels.
- As imagens são normalizadas para caber em uma bounding box de 28×28 pixels e suavizadas, introduzindo níveis de escala de cinza.
- O MNIST é amplamente utilizado para treinamento e teste no campo do aprendizado de máquina, especialmente para tarefas de classificação de imagem.
Estrutura do Conjunto de Dados
O conjunto de dados MNIST é dividido em dois subconjuntos:
- Conjunto de Treinamento: Este subconjunto contém 60.000 imagens de dígitos manuscritos usadas para treinar modelos de aprendizado de máquina.
- Conjunto de Teste: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.
Cada imagem no conjunto de dados é rotulada com o dígito correspondente (0-9), tornando-o um conjunto de dados de aprendizagem supervisionada ideal para tarefas de classificação.
MNIST Estendido (EMNIST)
O Extended MNIST (EMNIST) é um conjunto de dados mais recente desenvolvido e lançado pelo NIST para ser o sucessor do MNIST. Enquanto o MNIST incluía imagens apenas de dígitos manuscritos, o EMNIST inclui todas as imagens do NIST Special Database 19, que é um grande banco de dados de letras maiúsculas e minúsculas manuscritas, bem como dígitos. As imagens no EMNIST foram convertidas para o mesmo formato de pixel 28×28, pelo mesmo processo, assim como as imagens do MNIST. Consequentemente, as ferramentas que funcionam com o conjunto de dados MNIST mais antigo e menor provavelmente funcionarão sem modificações com o EMNIST.
Aplicações
O dataset MNIST é amplamente utilizado para treinar e avaliar modelos de aprendizado profundo em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizado de máquina. O formato simples e bem estruturado do dataset o torna um recurso essencial para pesquisadores e profissionais no campo de aprendizado de máquina e visão computacional.
Algumas aplicações comuns incluem:
- Benchmarking de novos algoritmos de classificação
- Fins educacionais para ensinar conceitos de machine learning
- Prototipagem de sistemas de reconhecimento de imagem
- Testando técnicas de otimização de modelo
Utilização
Para treinar um modelo CNN no conjunto de dados MNIST por 100 épocas com um tamanho de imagem de 32×32, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Amostras de Imagens e Anotações
O dataset MNIST contém imagens em escala de cinza de dígitos manuscritos, fornecendo um dataset bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do dataset:
O exemplo demonstra a variedade e complexidade dos dígitos manuscritos no conjunto de dados MNIST, destacando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.
Citações e Agradecimentos
Se você usar o conjunto de dados MNIST em seu trabalho de pesquisa ou desenvolvimento, cite o seguinte artigo:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
volume={2},
year={2010}
}
Gostaríamos de agradecer a Yann LeCun, Corinna Cortes e Christopher J.C. Burges por criar e manter o conjunto de dados MNIST como um recurso valioso para a comunidade de pesquisa em aprendizado de máquina e visão computacional. Para mais informações sobre o conjunto de dados MNIST e seus criadores, visite o site do conjunto de dados MNIST.
FAQ
O que é o conjunto de dados MNIST e por que ele é importante no aprendizado de máquina?
O conjunto de dados MNIST, ou Modified National Institute of Standards and Technology dataset, é uma coleção amplamente utilizada de dígitos manuscritos, projetada para treinar e testar sistemas de classificação de imagens. Inclui 60.000 imagens de treino e 10.000 imagens de teste, todas em tons de cinza e com tamanho de 28×28 pixels. A importância do conjunto de dados reside no seu papel como um benchmark padrão para avaliar algoritmos de classificação de imagens, ajudando pesquisadores e engenheiros a comparar métodos e acompanhar o progresso na área.
Como posso usar o Ultralytics YOLO para treinar um modelo no conjunto de dados MNIST?
Para treinar um modelo no conjunto de dados MNIST usando Ultralytics YOLO, você pode seguir estas etapas:
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Para obter uma lista detalhada dos argumentos de treinamento disponíveis, consulte a página de Treinamento.
Qual é a diferença entre os conjuntos de dados MNIST e EMNIST?
O dataset MNIST contém apenas dígitos manuscritos, enquanto o dataset Extended MNIST (EMNIST) inclui dígitos e letras maiúsculas e minúsculas. O EMNIST foi desenvolvido como um sucessor do MNIST e utiliza o mesmo formato de 28×28 pixels para as imagens, tornando-o compatível com ferramentas e modelos projetados para o dataset MNIST original. Essa gama mais ampla de caracteres no EMNIST o torna útil para uma variedade maior de aplicações de aprendizado de máquina.
Posso usar o Ultralytics HUB para treinar modelos em conjuntos de dados personalizados como o MNIST?
Sim, você pode usar o Ultralytics HUB para treinar modelos em conjuntos de dados personalizados como o MNIST. O Ultralytics HUB oferece uma interface amigável para carregar conjuntos de dados, treinar modelos e gerenciar projetos sem a necessidade de um amplo conhecimento de codificação. Para mais detalhes sobre como começar, confira a página Início Rápido do Ultralytics HUB.
Como o MNIST se compara a outros conjuntos de dados de classificação de imagens?
O MNIST é mais simples do que muitos conjuntos de dados modernos, como CIFAR-10 ou ImageNet, tornando-o ideal para iniciantes e experimentação rápida. Embora conjuntos de dados mais complexos ofereçam maiores desafios com imagens coloridas e diversas categorias de objetos, o MNIST permanece valioso por sua simplicidade, tamanho de arquivo pequeno e significado histórico no desenvolvimento de algoritmos de aprendizado de máquina. Para tarefas de classificação mais avançadas, considere usar o Fashion-MNIST, que mantém a mesma estrutura, mas apresenta itens de vestuário em vez de dígitos.