HomeObjects-3K-Datensatz
Der HomeObjects-3K-Datensatz ist eine kuratierte Sammlung von Bildern gängiger Haushaltsobjekte, die für das Training, Testen und Benchmarking von Computer-Vision-Modellen konzipiert wurde. Mit ~3.000 Bildern und 12 verschiedenen Objektklassen ist dieser Datensatz ideal für Forschung und Anwendungen in den Bereichen Innenraumszenen, Smart Home-Geräte, Robotik und Augmented Reality.
Struktur des Datensatzes
Der HomeObjects-3K-Datensatz gliedert sich in die folgenden Teilmengen:
- Übungssatz: Besteht aus 2.285 kommentierten Bildern mit Objekten wie Sofas, Stühlen, Tischen, Lampen und mehr.
- Validierungssatz: Enthält 404 kommentierte Bilder, die für die Bewertung der Modellleistung bestimmt sind.
Jedes Bild wird mithilfe von Begrenzungsrahmen beschriftet, die an der Ultralytics YOLO Format ausgerichtet. Die Vielfalt der Innenraumbeleuchtung, des Objektmaßstabs und der Ausrichtungen macht es robust für reale Einsatzszenarien.
Objekt-Klassen
Der Datensatz unterstützt 12 Kategorien von Alltagsgegenständen, darunter Möbel, Elektronik und Dekorationsartikel. Diese Klassen wurden so gewählt, dass sie die in häuslichen Umgebungen häufig anzutreffenden Gegenstände widerspiegeln und Sehaufgaben wie Objekterkennung und Objektverfolgung unterstützen.
HomeObjects-3K-Klassen
- Bett
- Sofa
- Stuhl
- Tabelle
- Lampe
- TV
- Laptop
- Kleiderschrank
- Fenster
- Tür
- Topfpflanze
- Fotorahmen
Anwendungen
HomeObjects-3K ermöglicht ein breites Spektrum von Anwendungen im Bereich der Computer Vision für Innenräume, sowohl in der Forschung als auch in der realen Produktentwicklung:
-
Erkennung von Objekten in Innenräumen: Verwenden Sie Modelle wie Ultralytics YOLO11 um gängige Haushaltsgegenstände wie Betten, Stühle, Lampen und Laptops in Bildern zu finden und zu lokalisieren. Dies hilft beim Echtzeit-Verständnis von Innenraumszenen.
-
Analyse des Szenenlayouts: In der Robotik und bei Smart-Home-Systemen hilft dies den Geräten zu verstehen, wie Räume angeordnet sind und wo sich Objekte wie Türen, Fenster und Möbel befinden, damit sie sicher navigieren und mit ihrer Umgebung richtig interagieren können.
-
AR-Anwendungen: Nutzen Sie Objekterkennungsfunktionen in Anwendungen, die Augmented Reality verwenden. Erkennen Sie zum Beispiel Fernseher oder Schränke und zeigen Sie zusätzliche Informationen oder Effekte an.
-
Bildung und Forschung: Unterstützen Sie Lern- und akademische Projekte, indem Sie Studenten und Forschern einen sofort einsetzbaren Datensatz zur Verfügung stellen, mit dem sie die Erkennung von Objekten in Innenräumen anhand realer Beispiele üben können.
-
Hausinventarisierung und Nachverfolgung von Vermögenswerten: Automatische Erkennung und Auflistung von Haushaltsgegenständen in Fotos oder Videos, nützlich für die Verwaltung von Eigentum, die Organisation von Räumen oder die Visualisierung von Möbeln in Immobilien.
Datensatz YAML
Die Konfiguration des HomeObjects-3K-Datensatzes wird über eine YAML-Datei bereitgestellt. Diese Datei enthält wichtige Informationen wie die Bildpfade für die Zug- und Validierungsverzeichnisse und die Liste der Objektklassen.
Sie können auf die HomeObjects-3K.yaml
Datei direkt aus dem Ultralytics unter: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
# └── homeobjects-3K ← downloads here (390 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/homeobjects-3K # dataset root dir
train: train/images # train images (relative to 'path') 2285 images
val: valid/images # val images (relative to 'path') 404 images
test: # test images (relative to 'path')
# Classes
names:
0: bed
1: sofa
2: chair
3: table
4: lamp
5: tv
6: laptop
7: wardrobe
8: window
9: door
10: potted plant
11: photo frame
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zip
Verwendung
Sie können ein YOLO11n-Modell auf dem HomeObjects-3K-Datensatz für 100 Epochen mit einer Bildgröße von 640 trainieren. Die folgenden Beispiele zeigen, wie Sie beginnen können. Weitere Trainingsoptionen und detaillierte Einstellungen finden Sie in der Trainingsanleitung.
Beispiel für einen Zug
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo11n.pt")
# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640
Beispielbilder und -kommentare
Der Datensatz enthält eine umfangreiche Sammlung von Innenraumbildern, die eine Vielzahl von Haushaltsgegenständen in natürlichen Wohnumgebungen zeigen. Nachfolgend finden Sie Bildbeispiele aus dem Datensatz, jeweils gepaart mit den entsprechenden Kommentaren zur Veranschaulichung von Objektpositionen, Maßstäben und räumlichen Beziehungen.
Lizenz und Namensnennung
HomeObjects-3K wird entwickelt und herausgegeben von dem Ultralytics unter der AGPL-3.0 entwickelt und veröffentlicht, die Open-Source-Forschung und kommerzielle Nutzung mit angemessener Namensnennung unterstützt.
Wenn Sie diesen Datensatz in Ihrer Forschung verwenden, zitieren Sie ihn bitte unter Verwendung der angegebenen Details:
@dataset{Jocher_Ultralytics_Datasets_2025,
author = {Jocher, Glenn and Rizwan, Muhammad},
license = {AGPL-3.0},
month = {May},
title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
url = {https://docs.ultralytics.com/datasets/detect/homeobject-3k/},
version = {1.0.0},
year = {2025}
}
FAQ
Wofür ist der HomeObjects-3K-Datensatz gedacht?
HomeObjects-3K wurde entwickelt, um das KI-Verständnis von Innenraumszenen zu verbessern. Der Schwerpunkt liegt auf der Erkennung von alltäglichen Haushaltsgegenständen wie Betten, Sofas, Fernsehern und Lampen, was ihn ideal für Anwendungen in den Bereichen Smart Home, Robotik, Augmented Reality und Innenraumüberwachungssysteme macht. Ob Sie nun Modelle für Echtzeit-Edge-Geräte oder für die akademische Forschung trainieren, dieser Datensatz bietet eine ausgewogene Grundlage.
Welche Objektkategorien sind enthalten, und warum wurden sie ausgewählt?
Der Datensatz umfasst 12 der am häufigsten vorkommenden Haushaltsgegenstände: Bett, Sofa, Stuhl, Tisch, Lampe, Fernseher, Laptop, Kleiderschrank, Fenster, Tür, Topfpflanze und Bilderrahmen. Diese Objekte wurden ausgewählt, um realistische Innenraumumgebungen widerzuspiegeln und um Mehrzweckaufgaben wie Roboternavigation oder Szenengenerierung in AR/VR-Anwendungen zu unterstützen.
Wie kann ich ein YOLO mit dem HomeObjects-3K-Datensatz trainieren?
Um ein YOLO wie YOLO11n zu trainieren, brauchen Sie nur die HomeObjects-3K.yaml
Konfigurationsdatei und die vortrainiertes Modell Gewichte. Unabhängig davon, ob Sie Python oder die CLI verwenden, kann das Training mit einem einzigen Befehl gestartet werden. Sie können Parameter wie Epochen, Bildgröße und Stapelgröße je nach Zielleistung und Hardwarekonfiguration anpassen.
Beispiel für einen Zug
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo11n.pt")
# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640
Ist dieser Datensatz für Projekte von Anfängern geeignet?
Auf jeden Fall. Mit sauberer Beschriftung und standardisierten YOLO Anmerkungen ist HomeObjects-3K ein hervorragender Einstieg für Studenten und Hobbyisten, die die reale Objekterkennung in Innenräumen erforschen möchten. Es lässt sich auch gut für komplexere Anwendungen in kommerziellen Umgebungen skalieren.
Wo finde ich das Annotationsformat und YAML?
Siehe den Abschnitt Datensatz YAML. Das Format ist standardmäßig YOLO, wodurch es mit den meisten Objekterkennungs-Pipelines kompatibel ist.