Saltar para o conteúdo

HomeObjectos-3K Conjunto de dados

InícioConjunto de dados Objectos-3K em Colab

O conjunto de dados HomeObjects-3K é uma coleção de imagens de objectos domésticos comuns, concebida para treinar, testar e aferir modelos de visão por computador. Com cerca de 3.000 imagens e 12 classes de objectos distintas, este conjunto de dados é ideal para investigação e aplicações na compreensão de cenas interiores, dispositivos domésticos inteligentes, robótica e realidade aumentada.

Estrutura do conjunto de dados

O conjunto de dados HomeObjects-3K está organizado nos seguintes subconjuntos:

  • Conjunto de treino: Inclui 2.285 imagens anotadas com objectos como sofás, cadeiras, mesas, candeeiros, entre outros.
  • Conjunto de validação: Inclui 404 imagens anotadas designadas para avaliar o desempenho do modelo.

Cada imagem é etiquetada utilizando caixas delimitadoras alinhadas com o Ultralytics YOLO do Ultralytics. A diversidade de iluminação interior, escala de objectos e orientações torna-o robusto para cenários de implementação no mundo real.

Classes de objectos

O conjunto de dados suporta 12 categorias de objectos do quotidiano, abrangendo mobiliário, eletrónica e artigos decorativos. Estas classes foram escolhidas para refletir os objectos comuns encontrados em ambientes domésticos interiores e apoiar tarefas de visão como a deteção e o seguimento de objectos.

Classes HomeObjects-3K

  1. cama
  2. sofá
  3. cadeira
  4. tabela
  5. lâmpada
  6. televisão
  7. portátil
  8. guarda-roupa
  9. janela
  10. porta
  11. planta em vaso
  12. moldura fotográfica

Aplicações

O HomeObjects-3K permite um vasto espetro de aplicações na visão computacional de interiores, abrangendo tanto a investigação como o desenvolvimento de produtos no mundo real:

  • Deteção de objectos em interiores: Utilizar modelos como Ultralytics YOLO11 para encontrar e localizar objectos domésticos comuns como camas, cadeiras, candeeiros e computadores portáteis em imagens. Isto ajuda a compreender em tempo real as cenas de interiores.

  • Análise da disposição da cena: Na robótica e nos sistemas domésticos inteligentes, isto ajuda os dispositivos a compreender como as divisões estão organizadas, onde estão objectos como portas, janelas e mobiliário, para que possam navegar em segurança e interagir corretamente com o seu ambiente.

  • Aplicações de RA: Potencialize as funcionalidades de reconhecimento de objectos em aplicações que utilizam a realidade aumentada. Por exemplo, detetar televisores ou roupeiros e mostrar informações ou efeitos adicionais sobre eles.

  • Ensino e investigação: Apoiar a aprendizagem e os projectos académicos, fornecendo aos estudantes e investigadores um conjunto de dados pronto a utilizar para praticar a deteção de objectos em interiores com exemplos do mundo real.

  • Inventário doméstico e localização de bens: Detetar e listar automaticamente itens domésticos em fotografias ou vídeos, úteis para gerir pertences, organizar espaços ou visualizar mobiliário em imóveis.

Conjunto de dados YAML

A configuração do conjunto de dados HomeObjects-3K é fornecida através de um ficheiro YAML. Este ficheiro descreve informações essenciais, como caminhos de imagem para diretórios de treino e validação, e a lista de classes de objectos. É possível aceder ao ficheiro HomeObjects-3K.yaml diretamente do repositório Ultralytics em: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml

ultralytics.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── homeobjects-3K  ← downloads here (390 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/homeobjects-3K # dataset root dir
train: train/images # train images (relative to 'path') 2285 images
val: valid/images # val images (relative to 'path') 404 images
test: # test images (relative to 'path')

# Classes
names:
  0: bed
  1: sofa
  2: chair
  3: table
  4: lamp
  5: tv
  6: laptop
  7: wardrobe
  8: window
  9: door
  10: potted plant
  11: photo frame

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zip

Utilização

Pode treinar um modelo YOLO11n no conjunto de dados HomeObjects-3K para 100 épocas utilizando um tamanho de imagem de 640. Os exemplos abaixo mostram como começar. Para obter mais opções de treinamento e configurações detalhadas, consulte o Guia de treinamento.

Exemplo de comboio

from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo11n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640

Exemplos de imagens e anotações

O conjunto de dados apresenta uma coleção rica de imagens de cenas de interiores que captam uma vasta gama de objectos domésticos em ambientes domésticos naturais. Abaixo encontram-se exemplos visuais do conjunto de dados, cada um deles emparelhado com as anotações correspondentes para ilustrar as posições, escalas e relações espaciais dos objectos.

Imagem de amostra do conjunto de dados HomeObjects-3K, destacando diferentes objectos, ou seja, camas, cadeiras, portas, sofás e plantas

Licença e atribuição

O HomeObjects-3K foi desenvolvido e lançado pela equipa do equipaUltralytics sob a licençaAGPL-3.0 , apoiando a pesquisa de código aberto e o uso comercial com a devida atribuição.

Se utilizar este conjunto de dados na sua investigação, cite-o utilizando os dados mencionados:

@dataset{Jocher_Ultralytics_Datasets_2025,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {May},
    title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/homeobject-3k/},
    version = {1.0.0},
    year = {2025}
}

FAQ

Para que foi concebido o conjunto de dados HomeObjects-3K?

O HomeObjects-3K foi concebido para melhorar a compreensão de cenas interiores por parte da IA. Centra-se na deteção de artigos domésticos do quotidiano - como camas, sofás, televisores e candeeiros - tornando-o ideal para aplicações em casas inteligentes, robótica, realidade aumentada e sistemas de monitorização de interiores. Quer esteja a treinar modelos para dispositivos de ponta em tempo real ou para investigação académica, este conjunto de dados fornece uma base equilibrada.

Que categorias de objectos estão incluídas e porque foram selecionadas?

O conjunto de dados inclui 12 dos objectos domésticos mais comuns: cama, sofá, cadeira, mesa, candeeiro, televisão, computador portátil, roupeiro, janela, porta, vaso de plantas e moldura fotográfica. Estes objectos foram escolhidos para refletir ambientes interiores realistas e para apoiar tarefas polivalentes, como a navegação robótica ou a geração de cenas em aplicações AR/VR.

Como posso treinar um modelo YOLO utilizando o conjunto de dados HomeObjects-3K?

Para treinar um modelo YOLO como o YOLO11n, só precisa do HomeObjects-3K.yaml e o ficheiro de configuração modelo pré-treinado pesos. Quer esteja a utilizar Python ou a CLI, o treino pode ser iniciado com um único comando. É possível personalizar parâmetros como épocas, tamanho da imagem e tamanho do lote, dependendo do desempenho pretendido e da configuração do hardware.

Exemplo de comboio

from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo11n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640

Este conjunto de dados é adequado para projectos de nível iniciante?

Sem dúvida. Com uma rotulagem limpa e anotações padronizadas YOLO, o HomeObjects-3K é um excelente ponto de entrada para estudantes e amadores que querem explorar a deteção de objectos do mundo real em cenários interiores. Também se adapta bem a aplicações mais complexas em ambientes comerciais.

Onde posso encontrar o formato de anotação e o YAML?

Consulte a secção Dataset YAML. O formato é YOLO padrão, tornando-o compatível com a maioria dos pipelines de deteção de objectos.



📅C riado há 20 dias ✏️ Atualizado há 10 dias

Comentários