Перейти к содержанию

ГлавнаяОбъекты-3К Набор данных

ГлавнаяОбъекты-3К Набор данных в Colab

Набор данных HomeObjects-3K - это коллекция изображений обычных бытовых предметов, предназначенная для обучения, тестирования и проверки моделей компьютерного зрения. Этот набор данных, содержащий ~3 000 изображений и 12 различных классов объектов, идеально подходит для исследований и приложений в области понимания сцен внутри помещений, устройств "умного дома", робототехники и дополненной реальности.

Структура набора данных

Набор данных HomeObjects-3K разбит на следующие подмножества:

  • Обучающий набор: Состоит из 2 285 аннотированных изображений, на которых изображены такие объекты, как диваны, кресла, столы, лампы и многое другое.
  • Набор для проверки: Включает 404 аннотированных изображения, предназначенных для оценки эффективности модели.

Каждое изображение маркируется с помощью ограничительных рамок, выровненных по Ultralytics YOLO формат. Разнообразие освещения в помещении, масштабов объектов и ориентации делает эту систему надежной для использования в реальных сценариях развертывания.

Классы объектов

Набор данных поддерживает 12 категорий повседневных объектов, включая мебель, электронику и предметы декора. Эти классы выбраны таким образом, чтобы отражать распространенные предметы, встречающиеся в домашней обстановке, и поддерживать такие задачи зрения, как обнаружение и отслеживание объектов.

Классы HomeObjects-3K

  1. кровать
  2. Диван
  3. кресло
  4. таблица
  5. лампа
  6. телевизор
  7. ноутбук
  8. гардероб
  9. окно
  10. дверь
  11. комнатное растение
  12. фоторамка

Приложения

HomeObjects-3K обеспечивает широкий спектр приложений в области компьютерного зрения в помещениях, охватывая как исследования, так и разработку реальных продуктов:

  • Обнаружение объектов в помещении: Используйте такие модели, как Ultralytics YOLO11 для поиска и определения местоположения на изображениях таких распространенных домашних предметов, как кровати, стулья, лампы и ноутбуки. Это помогает в реальном времени понимать сцены в помещениях.

  • Разбор схемы расположения сцены: В робототехнике и системах "умного дома" это помогает устройствам понять, как устроены комнаты, где находятся такие объекты, как двери, окна и мебель, чтобы они могли безопасно перемещаться и правильно взаимодействовать с окружающей средой.

  • AR-приложения: Включите функции распознавания объектов в приложениях, использующих дополненную реальность. Например, обнаруживайте телевизоры или шкафы и показывайте на них дополнительную информацию или эффекты.

  • Образование и исследования: Поддержите учебные и научные проекты, предоставив студентам и исследователям готовый к использованию набор данных для тренировки обнаружения объектов в помещениях на реальных примерах.

  • Инвентаризация дома и отслеживание имущества: Автоматическое обнаружение и составление списка домашних вещей на фотографиях или видео. Это полезно для управления вещами, организации пространства или визуализации мебели в недвижимости.

Набор данных YAML

Конфигурация набора данных HomeObjects-3K задается в файле YAML. В этом файле указана важная информация, такая как пути к изображениям для каталогов обучения и проверки, а также список классов объектов. Вы можете получить доступ к HomeObjects-3K.yaml файл непосредственно из репозитория Ultralytics по адресу: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml

ultralytics.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── homeobjects-3K  ← downloads here (390 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/homeobjects-3K # dataset root dir
train: train/images # train images (relative to 'path') 2285 images
val: valid/images # val images (relative to 'path') 404 images
test: # test images (relative to 'path')

# Classes
names:
  0: bed
  1: sofa
  2: chair
  3: table
  4: lamp
  5: tv
  6: laptop
  7: wardrobe
  8: window
  9: door
  10: potted plant
  11: photo frame

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zip

Использование

Вы можете обучить модель YOLO11n на наборе данных HomeObjects-3K в течение 100 эпох, используя размер изображения 640. В примерах ниже показано, как начать обучение. Дополнительные возможности обучения и подробные настройки см. в руководстве по обучению.

Пример поезда

from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo11n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640

Образцы изображений и аннотаций

В наборе данных представлена богатая коллекция изображений внутренних сцен, на которых запечатлен широкий спектр бытовых предметов в естественной домашней обстановке. Ниже приведены примеры изображений из набора данных, каждое из которых сопровождается соответствующими аннотациями, иллюстрирующими положение, масштаб и пространственные отношения объектов.

Образец изображения из набора данных HomeObjects-3K, на котором выделены различные объекты: кровати, кресла, двери, диваны и растения

Лицензия и атрибуция

HomeObjects-3K разрабатывается и выпускается командойUltralytics под лицензиейAGPL-3.0 , поддерживающей исследования с открытым исходным кодом и коммерческое использование с надлежащим указанием авторства.

Если вы используете этот набор данных в своих исследованиях, пожалуйста, ссылайтесь на него, используя указанные данные:

@dataset{Jocher_Ultralytics_Datasets_2025,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {May},
    title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/homeobject-3k/},
    version = {1.0.0},
    year = {2025}
}

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Для чего предназначен набор данных HomeObjects-3K?

HomeObjects-3K разработан для улучшения понимания искусственным интеллектом сцен в помещениях. Он ориентирован на обнаружение повседневных бытовых предметов - кроватей, диванов, телевизоров и ламп, что делает его идеальным для применения в умных домах, робототехнике, дополненной реальности и системах мониторинга интерьера. Независимо от того, обучаете ли вы модели для краевых устройств реального времени или проводите академические исследования, этот набор данных обеспечивает сбалансированную основу.

Какие категории объектов включены и почему они были выбраны?

Набор данных включает 12 наиболее часто встречающихся предметов домашнего обихода: кровать, диван, кресло, стол, лампа, телевизор, ноутбук, шкаф, окно, дверь, комнатное растение и фоторамка. Эти объекты были выбраны для отражения реалистичной обстановки в помещении и поддержки многоцелевых задач, таких как роботизированная навигация или создание сцен в AR/VR-приложениях.

Как обучить модель YOLO с помощью набора данных HomeObjects-3K?

Чтобы обучить модель YOLO , такую как YOLO11n, вам понадобится только HomeObjects-3K.yaml файл конфигурации и предварительно обученная модель весов. Независимо от того, используете ли вы Python или CLI, обучение можно запустить с помощью одной команды. Вы можете настроить такие параметры, как эпохи, размер изображения и размер партии, в зависимости от целевой производительности и аппаратных настроек.

Пример поезда

from ultralytics import YOLO

# Load pretrained model
model = YOLO("yolo11n.pt")

# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640

Подходит ли этот набор данных для проектов начального уровня?

Безусловно. Благодаря чистой маркировке и стандартным аннотациям, YOLO, HomeObjects-3K является отличной отправной точкой для студентов и любителей, которые хотят изучить обнаружение реальных объектов в помещениях. Он также хорошо масштабируется для более сложных приложений в коммерческих средах.

Где найти формат аннотаций и YAML?

Обратитесь к разделу Dataset YAML. Формат является стандартным YOLO, что делает его совместимым с большинством конвейеров обнаружения объектов.



📅 Создано 20 дней назад ✏️ Обновлено 10 дней назад

Комментарии