Conjunto de Dados ImageNet10
O conjunto de dados ImageNet10 é um subconjunto em pequena escala do banco de dados ImageNet, desenvolvido pela Ultralytics e projetado para testes de CI, verificações de sanidade e testes rápidos de pipelines de treinamento. Este conjunto de dados é composto pela primeira imagem no conjunto de treinamento e pela primeira imagem do conjunto de validação das 10 primeiras classes no ImageNet. Embora significativamente menor, ele retém a estrutura e a diversidade do conjunto de dados ImageNet original.
Principais Características
- ImageNet10 é uma versão compacta do ImageNet, com 20 imagens representando as 10 primeiras classes do conjunto de dados original.
- O conjunto de dados é organizado de acordo com a hierarquia WordNet, espelhando a estrutura do conjunto de dados ImageNet completo.
- É ideal para testes de CI, verificações de sanidade e testes rápidos de pipelines de treinamento em tarefas de visão computacional.
- Embora não tenha sido projetado para benchmarking de modelos, ele pode fornecer uma indicação rápida da funcionalidade básica e correção de um modelo.
Estrutura do Conjunto de Dados
O dataset ImageNet10, como o ImageNet original, é organizado usando a hierarquia WordNet. Cada uma das 10 classes no ImageNet10 é descrita por um synset (uma coleção de termos sinônimos). As imagens no ImageNet10 são anotadas com um ou mais synsets, fornecendo um recurso compacto para testar modelos para reconhecer vários objetos e seus relacionamentos.
Aplicações
O dataset ImageNet10 é útil para testar e depurar rapidamente modelos e pipelines de visão computacional. Seu tamanho pequeno permite iteração rápida, tornando-o ideal para testes de integração contínua e verificações de sanidade. Ele também pode ser usado para testes preliminares rápidos de novos modelos ou alterações em modelos existentes antes de passar para testes em grande escala com o dataset ImageNet completo.
Utilização
Para testar um modelo de aprendizado profundo no conjunto de dados ImageNet10 com um tamanho de imagem de 224x224, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.
Exemplo de Teste
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Amostras de Imagens e Anotações
O conjunto de dados ImageNet10 contém um subconjunto de imagens do conjunto de dados ImageNet original. Essas imagens são escolhidas para representar as 10 primeiras classes do conjunto de dados, fornecendo um conjunto de dados diversificado, porém compacto, para testes e avaliações rápidas.
O exemplo demonstra a variedade e complexidade das imagens no conjunto de dados ImageNet10, destacando sua utilidade para verificações de sanidade e testes rápidos de modelos de visão computacional.
Citações e Agradecimentos
Se você usar o conjunto de dados ImageNet10 em seu trabalho de pesquisa ou desenvolvimento, cite o artigo original do ImageNet:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
Gostaríamos de agradecer à equipe ImageNet, liderada por Olga Russakovsky, Jia Deng e Li Fei-Fei, por criar e manter o conjunto de dados ImageNet. O conjunto de dados ImageNet10, embora seja um subconjunto compacto, é um recurso valioso para testes rápidos e depuração na comunidade de pesquisa de aprendizado de máquina e visão computacional. Para obter mais informações sobre o conjunto de dados ImageNet e seus criadores, visite o site do ImageNet.
FAQ
O que é o conjunto de dados ImageNet10 e como ele é diferente do conjunto de dados ImageNet completo?
O conjunto de dados ImageNet10 é um subconjunto compacto do banco de dados ImageNet original, criado pela Ultralytics para testes rápidos de CI, verificações de sanidade e avaliações de pipeline de treinamento. O ImageNet10 compreende apenas 20 imagens, representando a primeira imagem nos conjuntos de treinamento e validação das 10 primeiras classes no ImageNet. Apesar de seu pequeno tamanho, ele mantém a estrutura e a diversidade do conjunto de dados completo, tornando-o ideal para testes rápidos, mas não para avaliação comparativa de modelos.
Como posso usar o conjunto de dados ImageNet10 para testar meu modelo de aprendizado profundo?
Para testar seu modelo de aprendizado profundo no conjunto de dados ImageNet10 com um tamanho de imagem de 224x224, use os seguintes trechos de código.
Exemplo de Teste
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Consulte a página de Treinamento para obter uma lista completa dos argumentos disponíveis.
Por que devo usar o conjunto de dados ImageNet10 para testes de CI e verificações de sanidade?
O conjunto de dados ImageNet10 foi projetado especificamente para testes de CI, verificações de sanidade e avaliações rápidas em pipelines de aprendizado profundo. Seu pequeno tamanho permite iteração e testes rápidos, tornando-o perfeito para processos de integração contínua onde a velocidade é crucial. Ao manter a complexidade estrutural e a diversidade do conjunto de dados ImageNet original, o ImageNet10 fornece uma indicação confiável da funcionalidade básica e correção de um modelo sem a sobrecarga de processar um grande conjunto de dados.
Quais são as principais características do conjunto de dados ImageNet10?
O conjunto de dados ImageNet10 tem vários recursos importantes:
- Tamanho Compacto: Com apenas 20 imagens, permite testes e depurações rápidas.
- Organização Estruturada: Segue a hierarquia WordNet, semelhante ao conjunto de dados ImageNet completo.
- CI e Verificações de Sanidade: Ideal para testes de integração contínua e verificações de sanidade.
- Não é para Benchmarking: Embora seja útil para avaliações rápidas de modelos, não foi projetado para benchmarking extensivo.
Como o ImageNet10 se compara a outros conjuntos de dados pequenos como o ImageNette?
Embora tanto o ImageNet10 quanto o ImageNette sejam subconjuntos do ImageNet, eles servem a propósitos diferentes. O ImageNet10 contém apenas 20 imagens (2 por classe) das primeiras 10 classes do ImageNet, tornando-o extremamente leve para testes de CI e verificações rápidas de sanidade. Em contraste, o ImageNette contém milhares de imagens em 10 classes facilmente distinguíveis, tornando-o mais adequado para o treinamento e desenvolvimento real do modelo. O ImageNet10 é projetado para verificação da funcionalidade do pipeline, enquanto o ImageNette é melhor para experimentos de treinamento significativos, mas mais rápidos do que o ImageNet completo.