Ir para o conteúdo

Conjunto de Dados HomeObjects-3K

Conjunto de Dados HomeObjects-3K No Colab

O conjunto de dados HomeObjects-3K é uma coleção selecionada de imagens de objetos domésticos comuns, projetada para treinamento, teste e benchmarking de modelos de visão computacional. Apresentando ~3.000 imagens e 12 classes de objetos distintos, este conjunto de dados é ideal para pesquisa e aplicações em compreensão de cenas internas, dispositivos domésticos inteligentes, robótica e realidade aumentada.

Estrutura do Conjunto de Dados

O conjunto de dados HomeObjects-3K é organizado nos seguintes subconjuntos:

  • Conjunto de Treinamento: Compreende 2.285 imagens anotadas com objetos como sofás, cadeiras, mesas, lâmpadas e muito mais.
  • Conjunto de Validação: Inclui 404 imagens anotadas designadas para avaliar o desempenho do modelo.

Cada imagem é rotulada usando caixas delimitadoras alinhadas com o formato Ultralytics YOLO. A diversidade de iluminação interna, escala de objetos e orientações torna-o robusto para cenários de implantação no mundo real.

Classes de Objetos

O conjunto de dados suporta 12 categorias de objetos do cotidiano, abrangendo móveis, eletrônicos e itens decorativos. Essas classes são escolhidas para refletir itens comuns encontrados em ambientes domésticos internos e suportar tarefas de visão como detecção de objetos e rastreamento de objetos.

Classes HomeObjects-3K

  1. cama
  2. sofá
  3. cadeira
  4. tabela
  5. lâmpada
  6. tv
  7. laptop
  8. guarda-roupa
  9. janela
  10. porta
  11. planta em vaso
  12. moldura de foto

Aplicações

HomeObjects-3K possibilita um amplo espectro de aplicações em visão computacional interna, abrangendo tanto pesquisa quanto desenvolvimento de produtos no mundo real:

  • Detecção de objetos em ambientes internos: Use modelos como o Ultralytics YOLO11 para encontrar e localizar itens domésticos comuns, como camas, cadeiras, luminárias e laptops em imagens. Isso ajuda no entendimento em tempo real de cenas internas.

  • Análise do layout da cena: Em robótica e sistemas domésticos inteligentes, isso ajuda os dispositivos a entender como os cômodos estão dispostos, onde estão objetos como portas, janelas e móveis, para que possam navegar com segurança e interagir adequadamente com seu ambiente.

  • Aplicações de RA: Potencializam os recursos de reconhecimento de objetos em aplicativos que usam realidade aumentada. Por exemplo, detecte TVs ou guarda-roupas e mostre informações ou efeitos extras sobre eles.

  • Educação e pesquisa: Apoia projetos de aprendizado e acadêmicos, fornecendo aos alunos e pesquisadores um conjunto de dados pronto para uso para praticar a detecção de objetos internos com exemplos do mundo real.

  • Inventário doméstico e rastreamento de ativos: Detecte e liste automaticamente itens domésticos em fotos ou vídeos, útil para gerenciar pertences, organizar espaços ou visualizar móveis em imóveis.

YAML do Conjunto de Dados

A configuração para o conjunto de dados HomeObjects-3K é fornecida por meio de um arquivo YAML. Este arquivo descreve informações essenciais, como caminhos de imagem para diretórios de treinamento e validação, e a lista de classes de objetos. Você pode acessar o HomeObjects-3K.yaml arquivo diretamente do repositório Ultralytics em: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml

ultralytics/cfg/datasets/HomeObjects-3K.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── homeobjects-3K ← downloads here (390 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: homeobjects-3K # dataset root dir
train: images/train # train images (relative to 'path') 2285 images
val: images/val # val images (relative to 'path') 404 images

# Classes
names:
  0: bed
  1: sofa
  2: chair
  3: table
  4: lamp
  5: tv
  6: laptop
  7: wardrobe
  8: window
  9: door
  10: potted plant
  11: photo frame

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zip

Utilização

Você pode treinar um modelo YOLO11n no conjunto de dados HomeObjects-3K por 100 épocas usando um tamanho de imagem de 640. Os exemplos abaixo mostram como começar. Para mais opções de treinamento e configurações detalhadas, consulte o guia de Treinamento.

Exemplo de Treinamento

from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo11n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640

Amostras de Imagens e Anotações

O conjunto de dados apresenta uma rica coleção de imagens de cenas internas que capturam uma ampla gama de objetos domésticos em ambientes domésticos naturais. Abaixo estão exemplos visuais do conjunto de dados, cada um emparelhado com suas anotações correspondentes para ilustrar posições, escalas e relações espaciais de objetos.

Imagem de amostra do conjunto de dados HomeObjects-3K, destacando diferentes objetos, ou seja, camas, cadeiras, portas, sofás e plantas

Licença e Atribuição

HomeObjects-3K é desenvolvido e lançado pela equipe Ultralytics sob a Licença AGPL-3.0, apoiando a pesquisa de código aberto e o uso comercial com a devida atribuição.

Se você usar este conjunto de dados em sua pesquisa, cite-o usando os detalhes mencionados:

@dataset{Jocher_Ultralytics_Datasets_2025,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {May},
    title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/homeobject-3k/},
    version = {1.0.0},
    year = {2025}
}

FAQ

Para que foi projetado o conjunto de dados HomeObjects-3K?

HomeObjects-3K é criado para promover o avanço da compreensão de IA de cenas internas. Ele se concentra na detecção de itens domésticos cotidianos—como camas, sofás, TVs e lâmpadas—tornando-o ideal para aplicações em casas inteligentes, robótica, realidade aumentada e sistemas de monitoramento de interiores. Se você está treinando modelos para dispositivos de borda em tempo real ou pesquisa acadêmica, este conjunto de dados fornece uma base equilibrada.

Quais categorias de objetos estão incluídas e por que foram selecionadas?

O conjunto de dados inclui 12 dos itens domésticos mais comuns: cama, sofá, cadeira, mesa, luminária, TV, laptop, guarda-roupa, janela, porta, planta em vaso e porta-retratos. Esses objetos foram escolhidos para refletir ambientes internos realistas e para suportar tarefas multiuso, como navegação robótica ou geração de cenas em aplicações de AR/VR.

Como posso treinar um modelo YOLO usando o conjunto de dados HomeObjects-3K?

Para treinar um modelo YOLO como o YOLO11n, você só precisa do HomeObjects-3K.yaml arquivo de configuração e o modelo pré-treinado pesos. Seja usando Python ou a CLI, o treinamento pode ser iniciado com um único comando. Você pode personalizar parâmetros como épocas, tamanho da imagem e tamanho do lote, dependendo do seu desempenho alvo e configuração de hardware.

Exemplo de Treinamento

from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo11n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640

Este conjunto de dados é adequado para projetos de nível iniciante?

Absolutamente. Com rotulagem limpa e anotações padronizadas compatíveis com YOLO, o HomeObjects-3K é um excelente ponto de partida para estudantes e amadores que desejam explorar a deteção de objetos do mundo real em cenários internos. Também escala bem para aplicações mais complexas em ambientes comerciais.

Onde posso encontrar o formato de anotação e o YAML?

Consulte a seção Dataset YAML. O formato é o YOLO padrão, tornando-o compatível com a maioria dos pipelines de deteção de objetos.



📅 Criado há 2 meses ✏️ Atualizado há 1 mês

Comentários