Ir para o conteúdo

Conjunto de Dados Fashion-MNIST

O conjunto de dados Fashion-MNIST é um banco de dados de imagens de artigos da Zalando—consistindo em um conjunto de treinamento de 60.000 exemplos e um conjunto de teste de 10.000 exemplos. Cada exemplo é uma imagem em escala de cinza de 28x28, associada a um rótulo de 10 classes. O Fashion-MNIST destina-se a servir como um substituto direto para o conjunto de dados MNIST original para benchmarking de algoritmos de aprendizado de máquina.



Assista: Como fazer Classificação de Imagem no conjunto de dados Fashion MNIST usando Ultralytics YOLO11

Principais Características

  • Fashion-MNIST contém 60.000 imagens de treinamento e 10.000 imagens de teste de artigos da Zalando.
  • O conjunto de dados compreende imagens em escala de cinza de tamanho 28x28 pixels.
  • Cada pixel tem um único valor de pixel associado a ele, indicando a claridade ou escuridão desse pixel, com números mais altos significando mais escuro. Este valor de pixel é um inteiro entre 0 e 255.
  • Fashion-MNIST é amplamente utilizado para treinamento e teste no campo de aprendizado de máquina, especialmente para tarefas de classificação de imagens.

Estrutura do Conjunto de Dados

O conjunto de dados Fashion-MNIST é dividido em dois subconjuntos:

  1. Conjunto de Treinamento: Este subconjunto contém 60.000 imagens usadas para treinar modelos de aprendizado de máquina.
  2. Conjunto de Teste: Este subconjunto consiste em 10.000 imagens usadas para testar e avaliar os modelos treinados.

Rótulos

Cada exemplo de treinamento e teste é atribuído a um dos seguintes rótulos:

0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot

Aplicações

O conjunto de dados Fashion-MNIST é amplamente utilizado para treinar e avaliar modelos de aprendizado profundo em tarefas de classificação de imagens, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizado de máquina. O formato simples e bem estruturado do conjunto de dados o torna um recurso essencial para pesquisadores e profissionais no campo do aprendizado de máquina e visão computacional.

Utilização

Para treinar um modelo CNN no conjunto de dados Fashion-MNIST por 100 épocas com um tamanho de imagem de 28x28, você pode usar os seguintes trechos de código. Para uma lista completa dos argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Amostras de Imagens e Anotações

O conjunto de dados Fashion-MNIST contém imagens em escala de cinza de imagens de artigos da Zalando, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e a complexidade das imagens no conjunto de dados Fashion-MNIST, destacando a importância de um conjunto de dados diversificado para treinar modelos robustos de classificação de imagens.

Agradecimentos

Se você usar o conjunto de dados Fashion-MNIST em seu trabalho de pesquisa ou desenvolvimento, reconheça o conjunto de dados vinculando ao repositório GitHub. Este conjunto de dados foi disponibilizado pela Zalando Research.

FAQ

O que é o conjunto de dados Fashion-MNIST e como ele é diferente do MNIST?

O conjunto de dados Fashion-MNIST é uma coleção de 70.000 imagens em escala de cinza de imagens de artigos da Zalando, destinado a ser um substituto moderno para o conjunto de dados MNIST original. Ele serve como um benchmark para modelos de aprendizado de máquina no contexto de tarefas de classificação de imagens. Ao contrário do MNIST, que contém dígitos manuscritos, o Fashion-MNIST consiste em imagens de 28x28 pixels categorizadas em 10 classes relacionadas à moda, como camiseta/top, calça e bota de cano curto.

Como posso treinar um modelo YOLO no conjunto de dados Fashion-MNIST?

Para treinar um modelo Ultralytics YOLO no conjunto de dados Fashion-MNIST, você pode usar comandos Python e CLI. Aqui está um exemplo rápido para você começar:

Exemplo de Treinamento

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Para parâmetros de treinamento mais detalhados, consulte a página de Treinamento.

Por que devo usar o conjunto de dados Fashion-MNIST para avaliar meus modelos de aprendizado de máquina?

O conjunto de dados Fashion-MNIST é amplamente reconhecido na comunidade de aprendizado profundo como uma alternativa robusta ao MNIST. Ele oferece um conjunto de imagens mais complexo e variado, tornando-o uma excelente escolha para avaliar modelos de classificação de imagens. A estrutura do conjunto de dados, compreendendo 60.000 imagens de treinamento e 10.000 imagens de teste, cada uma rotulada com uma de 10 classes, torna-o ideal para avaliar o desempenho de diferentes algoritmos de aprendizado de máquina em um contexto mais desafiador.

Posso usar o Ultralytics YOLO para tarefas de classificação de imagens como o Fashion-MNIST?

Sim, os modelos Ultralytics YOLO podem ser usados para tarefas de classificação de imagens, incluindo aquelas que envolvem o conjunto de dados Fashion-MNIST. O YOLO11, por exemplo, suporta várias tarefas de visão, como detecção, segmentação e classificação. Para começar com tarefas de classificação de imagens, consulte a página de Classificação.

Quais são as principais características e estrutura do conjunto de dados Fashion-MNIST?

O conjunto de dados Fashion-MNIST é dividido em dois subconjuntos principais: 60.000 imagens de treinamento e 10.000 imagens de teste. Cada imagem é uma imagem em escala de cinza de 28x28 pixels representando uma de 10 classes relacionadas à moda. A simplicidade e o formato bem estruturado o tornam ideal para treinar e avaliar modelos em tarefas de aprendizado de máquina e visão computacional. Para mais detalhes sobre a estrutura do conjunto de dados, consulte a seção Estrutura do Conjunto de Dados.

Como posso reconhecer o uso do conjunto de dados Fashion-MNIST em minha pesquisa?

Se você utilizar o conjunto de dados Fashion-MNIST em seus projetos de pesquisa ou desenvolvimento, é importante reconhecê-lo vinculando ao repositório do GitHub. Isso ajuda a atribuir os dados à Zalando Research, que disponibilizou o conjunto de dados para uso público.



📅 Criado há 1 ano ✏️ Atualizado há 6 meses

Comentários