Trang chủĐối tượng-3K Bộ dữ liệu
Bộ dữ liệu HomeObjects-3K là bộ sưu tập được tuyển chọn các hình ảnh vật thể gia dụng phổ biến, được thiết kế để đào tạo, thử nghiệm và đánh giá chuẩn các mô hình thị giác máy tính . Với khoảng 3.000 hình ảnh và 12 lớp vật thể riêng biệt, bộ dữ liệu này lý tưởng cho nghiên cứu và ứng dụng trong việc hiểu bối cảnh trong nhà, thiết bị nhà thông minh, robot và thực tế tăng cường.
Cấu trúc tập dữ liệu
Bộ dữ liệu HomeObjects-3K được tổ chức thành các tập hợp con sau:
- Bộ đào tạo : Bao gồm 2.285 hình ảnh có chú thích về các đồ vật như ghế sofa, ghế, bàn, đèn, v.v.
- Bộ xác thực : Bao gồm 404 hình ảnh có chú thích được chỉ định để đánh giá hiệu suất của mô hình.
Mỗi hình ảnh được gắn nhãn bằng các hộp giới hạn được căn chỉnh theo định dạng Ultralytics YOLO . Sự đa dạng về ánh sáng trong nhà, tỷ lệ vật thể và hướng khiến nó trở nên mạnh mẽ cho các tình huống triển khai trong thế giới thực.
Các lớp đối tượng
Bộ dữ liệu hỗ trợ 12 danh mục đối tượng hàng ngày, bao gồm đồ nội thất, đồ điện tử và đồ trang trí. Các lớp này được chọn để phản ánh các vật dụng thường gặp trong môi trường gia đình trong nhà và hỗ trợ các tác vụ thị giác như phát hiện và theo dõi đối tượng .
Trang chủĐối tượng-3K lớp
- giường
- ghế sofa
- cái ghế
- bàn
- đèn
- TV
- máy tính xách tay
- tủ quần áo
- cửa sổ
- cửa
- cây trồng trong chậu
- khung ảnh
Ứng dụng
HomeObjects-3K cho phép sử dụng rộng rãi trong lĩnh vực thị giác máy tính trong nhà, bao gồm cả nghiên cứu và phát triển sản phẩm thực tế:
-
Phát hiện vật thể trong nhà : Sử dụng các mô hình như Ultralytics YOLO11 để tìm và định vị các vật dụng gia đình thông thường như giường, ghế, đèn và máy tính xách tay trong hình ảnh. Điều này giúp hiểu được các cảnh trong nhà theo thời gian thực.
-
Phân tích bố cục cảnh : Trong hệ thống robot và nhà thông minh, điều này giúp các thiết bị hiểu cách sắp xếp các phòng, vị trí của các đồ vật như cửa ra vào, cửa sổ và đồ nội thất, để chúng có thể di chuyển an toàn và tương tác phù hợp với môi trường xung quanh.
-
Ứng dụng AR : Cung cấp các tính năng nhận dạng đối tượng trong các ứng dụng sử dụng thực tế tăng cường. Ví dụ: phát hiện TV hoặc tủ quần áo và hiển thị thông tin hoặc hiệu ứng bổ sung trên chúng.
-
Giáo dục và nghiên cứu : Hỗ trợ các dự án học thuật và học tập bằng cách cung cấp cho sinh viên và nhà nghiên cứu bộ dữ liệu sẵn sàng sử dụng để thực hành phát hiện vật thể trong nhà với các ví dụ thực tế.
-
Theo dõi tài sản và kiểm kê nhà cửa : Tự động phát hiện và liệt kê các vật dụng trong nhà bằng ảnh hoặc video, hữu ích cho việc quản lý đồ đạc, sắp xếp không gian hoặc hình dung đồ đạc trong bất động sản.
Bộ dữ liệu YAML
Cấu hình cho tập dữ liệu HomeObjects-3K được cung cấp thông qua tệp YAML. Tệp này phác thảo thông tin cần thiết như đường dẫn hình ảnh cho thư mục đào tạo và xác thực và danh sách các lớp đối tượng. Bạn có thể truy cập HomeObjects-3K.yaml
tập tin trực tiếp từ Ultralytics kho lưu trữ tại: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/HomeObjects-3K.yaml
ultralytics /cfg/datasets/HomeObjects-3K.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# HomeObjects-3K dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/homeobjects-3k/
# Example usage: yolo train data=HomeObjects-3K.yaml
# parent
# ├── ultralytics
# └── datasets
# └── homeobjects-3K ← downloads here (390 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/homeobjects-3K # dataset root dir
train: train/images # train images (relative to 'path') 2285 images
val: valid/images # val images (relative to 'path') 404 images
test: # test images (relative to 'path')
# Classes
names:
0: bed
1: sofa
2: chair
3: table
4: lamp
5: tv
6: laptop
7: wardrobe
8: window
9: door
10: potted plant
11: photo frame
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/homeobjects-3K.zip
Cách sử dụng
Bạn có thể đào tạo mô hình YOLO11n trên tập dữ liệu HomeObjects-3K trong 100 kỷ nguyên bằng cách sử dụng kích thước hình ảnh là 640. Các ví dụ bên dưới cho thấy cách bắt đầu. Để biết thêm các tùy chọn đào tạo và cài đặt chi tiết, hãy xem hướng dẫn Đào tạo .
Ví dụ về tàu hỏa
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo11n.pt")
# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640
Hình ảnh mẫu và chú thích
Bộ dữ liệu có một bộ sưu tập phong phú các hình ảnh cảnh trong nhà chụp nhiều loại đồ vật gia dụng trong môi trường nhà ở tự nhiên. Dưới đây là các hình ảnh mẫu từ bộ dữ liệu, mỗi hình ảnh được ghép nối với các chú thích tương ứng để minh họa vị trí, tỷ lệ và mối quan hệ không gian của đồ vật.
Giấy phép và Ghi công
HomeObjects-3K được nhóm Ultralytics phát triển và phát hành theo Giấy phép AGPL-3.0 , hỗ trợ nghiên cứu nguồn mở và sử dụng thương mại với ghi rõ nguồn gốc.
Nếu bạn sử dụng tập dữ liệu này trong nghiên cứu của mình, vui lòng trích dẫn theo các thông tin chi tiết đã nêu:
@dataset{Jocher_Ultralytics_Datasets_2025,
author = {Jocher, Glenn and Rizwan, Muhammad},
license = {AGPL-3.0},
month = {May},
title = {Ultralytics Datasets: HomeObjects-3K Detection Dataset},
url = {https://docs.ultralytics.com/datasets/detect/homeobject-3k/},
version = {1.0.0},
year = {2025}
}
CÂU HỎI THƯỜNG GẶP
Bộ dữ liệu HomeObjects-3K được thiết kế để làm gì?
HomeObjects-3K được thiết kế để nâng cao khả năng hiểu của AI về các cảnh trong nhà. Nó tập trung vào việc phát hiện các vật dụng gia đình hàng ngày—như giường, ghế sofa, TV và đèn—làm cho nó trở nên lý tưởng cho các ứng dụng trong nhà thông minh, robot, thực tế tăng cường và hệ thống giám sát nội thất. Cho dù bạn đang đào tạo các mô hình cho các thiết bị biên thời gian thực hay nghiên cứu học thuật, tập dữ liệu này cung cấp một nền tảng cân bằng.
Những danh mục đối tượng nào được bao gồm và tại sao chúng được chọn?
Bộ dữ liệu bao gồm 12 vật dụng gia đình thường gặp nhất: giường, ghế sofa, ghế, bàn, đèn, tivi, máy tính xách tay, tủ quần áo, cửa sổ, cửa ra vào, cây trồng trong chậu và khung ảnh. Những vật thể này được chọn để phản ánh môi trường trong nhà thực tế và hỗ trợ các tác vụ đa mục đích như điều hướng bằng rô-bốt hoặc tạo cảnh trong các ứng dụng AR/VR.
Làm thế nào tôi có thể đào tạo một YOLO mô hình sử dụng tập dữ liệu HomeObjects-3K?
Để đào tạo một YOLO mô hình như YOLO11n, bạn chỉ cần HomeObjects-3K.yaml
tập tin cấu hình và mô hình được đào tạo trước trọng lượng. Cho dù bạn đang sử dụng Python hoặc CLI , đào tạo có thể được khởi chạy bằng một lệnh duy nhất. Bạn có thể tùy chỉnh các thông số như kỷ nguyên, kích thước hình ảnh và kích thước lô tùy thuộc vào hiệu suất mục tiêu và thiết lập phần cứng của bạn.
Ví dụ về tàu hỏa
from ultralytics import YOLO
# Load pretrained model
model = YOLO("yolo11n.pt")
# Train the model on HomeObjects-3K dataset
model.train(data="HomeObjects-3K.yaml", epochs=100, imgsz=640)
yolo detect train data=HomeObjects-3K.yaml model=yolo11n.pt epochs=100 imgsz=640
Bộ dữ liệu này có phù hợp với các dự án ở cấp độ mới bắt đầu không?
Hoàn toàn. Với nhãn mác sạch sẽ và tiêu chuẩn hóa YOLO - chú thích tương thích, HomeObjects-3K là điểm khởi đầu tuyệt vời cho sinh viên và người đam mê muốn khám phá phát hiện đối tượng thực tế trong các tình huống trong nhà. Nó cũng mở rộng tốt cho các ứng dụng phức tạp hơn trong môi trường thương mại.
Tôi có thể tìm định dạng chú thích và YAML ở đâu?
Tham khảo phần Dataset YAML . Định dạng là chuẩn YOLO , làm cho nó tương thích với hầu hết các quy trình phát hiện đối tượng.