Ir para o conteúdo

Conjunto de Dados Caltech-256

O conjunto de dados Caltech-256 é uma extensa coleção de imagens usadas para tarefas de classificação de objetos. Contém cerca de 30.000 imagens divididas em 257 categorias (256 categorias de objetos e 1 categoria de fundo). As imagens são cuidadosamente selecionadas e anotadas para fornecer um benchmark desafiador e diversificado para algoritmos de reconhecimento de objetos.



Assista: Como Treinar Classificação de Imagem Modelo usando o Conjunto de Dados Caltech-256 com o Ultralytics HUB

Divisão Automática de Dados

O conjunto de dados Caltech-256, conforme fornecido, não vem com divisões de treino/validação predefinidas. No entanto, quando você usa os comandos de treinamento fornecidos nos exemplos de uso abaixo, a estrutura Ultralytics dividirá automaticamente o conjunto de dados para você. A divisão padrão usada é 80% para o conjunto de treinamento e 20% para o conjunto de validação.

Principais Características

  • O conjunto de dados Caltech-256 compreende cerca de 30.000 imagens coloridas divididas em 257 categorias.
  • Cada categoria contém um mínimo de 80 imagens.
  • As categorias abrangem uma ampla variedade de objetos do mundo real, incluindo animais, veículos, utensílios domésticos e pessoas.
  • As imagens têm tamanhos e resoluções variáveis.
  • O Caltech-256 é amplamente utilizado para treinamento e teste no campo do aprendizado de máquina, particularmente para tarefas de reconhecimento de objetos.

Estrutura do Conjunto de Dados

Assim como o Caltech-101, o conjunto de dados Caltech-256 não possui uma divisão formal entre conjuntos de treinamento e teste. Os usuários normalmente criam suas próprias divisões de acordo com suas necessidades específicas. Uma prática comum é usar um subconjunto aleatório de imagens para treinamento e as imagens restantes para teste.

Aplicações

O conjunto de dados Caltech-256 é amplamente utilizado para treinar e avaliar modelos de aprendizado profundo em tarefas de reconhecimento de objetos, como Redes Neurais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizado de máquina. Seu conjunto diversificado de categorias e imagens de alta qualidade o tornam um conjunto de dados valioso para pesquisa e desenvolvimento no campo de aprendizado de máquina e visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados Caltech-256 por 100 épocas, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Amostras de Imagens e Anotações

O conjunto de dados Caltech-256 contém imagens coloridas de alta qualidade de vários objetos, fornecendo um conjunto de dados abrangente para tarefas de reconhecimento de objetos. Aqui estão alguns exemplos de imagens do conjunto de dados (crédito):

Imagem de amostra do conjunto de dados

O exemplo mostra a diversidade e a complexidade dos objetos no conjunto de dados Caltech-256, enfatizando a importância de um conjunto de dados variado para treinar modelos robustos de reconhecimento de objetos.

Citações e Agradecimentos

Se você utilizar o conjunto de dados Caltech-256 em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Gostaríamos de agradecer a Gregory Griffin, Alex Holub e Pietro Perona por criar e manter o conjunto de dados Caltech-256 como um recurso valioso para a comunidade de pesquisa em aprendizado de máquina e visão computacional. Para mais informações sobre o conjunto de dados Caltech-256 e seus criadores, visite o site do conjunto de dados Caltech-256.

FAQ

O que é o conjunto de dados Caltech-256 e por que ele é importante para machine learning?

O conjunto de dados Caltech-256 é um grande conjunto de dados de imagens usado principalmente para tarefas de classificação de objetos em aprendizado de máquina e visão computacional. Consiste em cerca de 30.000 imagens coloridas divididas em 257 categorias, cobrindo uma ampla gama de objetos do mundo real. As imagens diversas e de alta qualidade do conjunto de dados o tornam um excelente benchmark para avaliar algoritmos de reconhecimento de objetos, o que é crucial para desenvolver modelos de aprendizado de máquina robustos.

Como posso treinar um modelo YOLO no conjunto de dados Caltech-256 usando python ou CLI?

Para treinar um modelo YOLO no conjunto de dados Caltech-256 por 100 épocas, você pode usar os seguintes trechos de código. Consulte a página de Treinamento do modelo para opções adicionais.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Quais são os casos de uso mais comuns para o conjunto de dados Caltech-256?

O conjunto de dados Caltech-256 é amplamente utilizado para várias tarefas de reconhecimento de objetos, como:

  • Treinando Redes Neurais Convolucionais (CNNs)
  • Avaliando o desempenho das Máquinas de Vetores de Suporte (SVMs)
  • Benchmarking de novos algoritmos de aprendizado profundo
  • Desenvolvendo modelos de detecção de objetos usando frameworks como o Ultralytics YOLO

Sua diversidade e anotações abrangentes o tornam ideal para pesquisa e desenvolvimento em aprendizado de máquina e visão computacional.

Como é que o conjunto de dados Caltech-256 está estruturado e dividido para treino e teste?

O conjunto de dados Caltech-256 não vem com uma divisão predefinida para treinamento e teste. Os usuários normalmente criam suas próprias divisões de acordo com suas necessidades específicas. Uma abordagem comum é selecionar aleatoriamente um subconjunto de imagens para treinamento e usar as imagens restantes para teste. Essa flexibilidade permite que os usuários adaptem o conjunto de dados aos requisitos específicos de seu projeto e configurações experimentais.

Por que devo usar o Ultralytics YOLO para treinar modelos no conjunto de dados Caltech-256?

Os modelos Ultralytics YOLO oferecem várias vantagens para treinamento no conjunto de dados Caltech-256:

  • Alta Precisão: Os modelos YOLO são conhecidos por seu desempenho de última geração em tarefas de detecção de objetos.
  • Velocidade: Eles fornecem capacidades de inferência em tempo real, tornando-os adequados para aplicações que exigem previsões rápidas.
  • Facilidade de Uso: Com o Ultralytics HUB, os usuários podem treinar, validar e implementar modelos sem codificação extensa.
  • Modelos Pré-treinados: Começando com modelos pré-treinados, como yolo11n-cls.pt, pode reduzir significativamente o tempo de treino e melhorar o modelo precisão.

Para obter mais detalhes, explore nosso guia de treinamento abrangente e aprenda sobre classificação de imagens com Ultralytics YOLO.



📅 Criado há 1 ano ✏️ Atualizado há 2 meses

Comentários