تخطي إلى المحتوى

نظرة عامة على مجموعات البيانات

توفر Ultralytics دعمًا لمجموعات بيانات متنوعة لتسهيل مهام الرؤية الحاسوبية مثل الكشف عن الأجسام، و تقسيم المثيلات، وتقدير الوضعية، والتصنيف، وتتبع الأجسام المتعددة. فيما يلي قائمة بمجموعات بيانات Ultralytics الرئيسية، متبوعة بملخص لكل مهمة من مهام الرؤية الحاسوبية ومجموعات البيانات الخاصة بها.



شاهد: نظرة عامة على مجموعات بيانات Ultralytics

الكشف عن الكائنات

الكشف عن الأجسام باستخدام المربعات المحيطة هو أسلوب رؤية حاسوبية يتضمن اكتشاف وتحديد مواقع الأجسام في صورة عن طريق رسم مربع محيط حول كل جسم.

  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثي الأبعاد والتنبؤ بالحركة من البيئات الحضرية مع تعليقات توضيحية غنية.
  • COCO: Common Objects in Context (COCO) هي مجموعة بيانات واسعة النطاق للكشف عن الأجسام وتقسيمها وتسميتها مع 80 فئة من الأجسام.
  • LVIS: مجموعة بيانات واسعة النطاق للكشف عن الأجسام وتقسيمها وتسميتها مع 1203 فئة من الأجسام.
  • COCO8: مجموعة فرعية أصغر من أول 4 صور من COCO train و COCO val، ومناسبة للاختبارات السريعة.
  • COCO8-Grayscale: نسخة ذات تدرج رمادي من COCO8 تم إنشاؤها عن طريق تحويل RGB إلى تدرج رمادي، وهي مفيدة لتقييم نموذج أحادي القناة.
  • COCO8-Multispectral: نسخة متعددة الأطياف ذات 10 قنوات من COCO8 تم إنشاؤها عن طريق استيفاء أطوال موجات RGB، وهي مفيدة لتقييم النموذج المدرك للطيف.
  • COCO128: مجموعة فرعية أصغر من أول 128 صورة من COCO train و COCO val، ومناسبة للاختبارات.
  • Global Wheat 2020: مجموعة بيانات تحتوي على صور لرؤوس القمح لتحدي القمح العالمي 2020.
  • Objects365: مجموعة بيانات عالية الجودة وواسعة النطاق للكشف عن الأجسام مع 365 فئة من الأجسام وأكثر من 600 ألف صورة مشروحة.
  • OpenImagesV7: مجموعة بيانات شاملة من Google مع 1.7 مليون صورة تدريب و 42 ألف صورة تحقق.
  • SKU-110K: مجموعة بيانات تتميز بالكشف الكثيف عن الأجسام في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة و 1.7 مليون مربع محيط.
  • HomeObjects-3K جديد 🚀: مجموعة بيانات للمشاهد الداخلية المشروحة والتي تعرض 12 عنصرًا منزليًا شائعًا، وهي مثالية لتطوير واختبار نماذج رؤية الكمبيوتر في أنظمة المنزل الذكي والروبوتات والواقع المعزز.
  • VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وتتبع الأجسام المتعددة من الصور التي تم التقاطها بواسطة الطائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.
  • VOC: مجموعة بيانات Pascal Visual Object Classes (VOC) لاكتشاف وتجزئة الكائنات، تحتوي على 20 فئة كائن وأكثر من 11 ألف صورة.
  • xView: مجموعة بيانات لاكتشاف الكائنات في الصور العلوية، تحتوي على 60 فئة كائن وأكثر من مليون كائن مُعلَّم.
  • RF100: معيار مرجعي متنوع لاكتشاف الكائنات يتضمن 100 مجموعة بيانات تغطي سبعة مجالات تصوير لتقييم شامل للنماذج.
  • Brain-tumor: مجموعة بيانات لاكتشاف أورام الدماغ تتضمن صور الرنين المغناطيسي (MRI) أو الأشعة المقطعية (CT) مع تفاصيل حول وجود الورم وموقعه وخصائصه.
  • African-wildlife: مجموعة بيانات تعرض صورًا للحياة البرية الأفريقية، بما في ذلك الجاموس والفيل ووحيد القرن والحمار الوحشي.
  • Signature: مجموعة بيانات تعرض صورًا لمستندات مختلفة مع توقيعات مُعلَّمة، لدعم التحقق من المستندات وأبحاث الكشف عن الاحتيال.
  • Medical-pills: مجموعة بيانات تحتوي على صور مُعلَّمة للأقراص الطبية، وهي مصممة للمساعدة في مهام مثل مراقبة الجودة الصيدلانية والفرز وضمان الامتثال لمعايير الصناعة.

تجزئة المثيل

تجزئة المثيل هي تقنية رؤية حاسوبية تتضمن تحديد وتوطين الكائنات في الصورة على مستوى البكسل. على عكس التجزئة الدلالية التي تصنف كل بكسل فقط، فإن تجزئة المثيل تميز بين الحالات المختلفة من نفس الفئة.

  • COCO: مجموعة بيانات واسعة النطاق مصممة لمهام اكتشاف الكائنات وتجزئتها والتعليق عليها، تحتوي على أكثر من 200 ألف صورة مُعلَّمة.
  • COCO8-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية للتجزئة.
  • COCO128-seg: مجموعة بيانات أصغر لمهام تجزئة المثيلات، تحتوي على مجموعة فرعية من 128 صورة COCO مع تعليقات توضيحية للتجزئة.
  • Crack-seg: مجموعة بيانات مُصممة خصيصًا لاكتشاف الشقوق على الطرق والجدران، وهي قابلة للتطبيق في مهام اكتشاف الكائنات وتجزئتها.
  • Package-seg: مجموعة بيانات مُخصصة لتحديد الطرود في المستودعات أو البيئات الصناعية، وهي مناسبة لتطبيقات اكتشاف الكائنات وتجزئتها.
  • Carparts-seg: مجموعة بيانات مُصممة خصيصًا لتحديد أجزاء المركبات، وتلبي احتياجات التصميم والتصنيع والبحث. وهي تخدم مهام اكتشاف الكائنات وتجزئتها.

تقدير الوضع

تقدير الوضعية هو أسلوب يستخدم لتحديد وضعية الكائن بالنسبة للكاميرا أو نظام الإحداثيات العالمي. يتضمن ذلك تحديد النقاط أو المفاصل الرئيسية على الكائنات، وخاصة البشر أو الحيوانات.

  • COCO: مجموعة بيانات واسعة النطاق مع تعليقات توضيحية لوضعية الإنسان مصممة لمهام تقدير الوضعية.
  • COCO8-pose: مجموعة بيانات أصغر لمهام تقدير الوضعية، تحتوي على مجموعة فرعية من 8 صور COCO مع تعليقات توضيحية لوضعية الإنسان.
  • Tiger-pose: مجموعة بيانات مدمجة تتكون من 263 صورة تركز على النمور، مع تعليقات توضيحية لـ 12 نقطة رئيسية لكل نمر لمهام تقدير الوضعية.
  • Hand-Keypoints: مجموعة بيانات موجزة تضم أكثر من 26000 صورة تركز على الأيدي البشرية، مع تعليقات توضيحية لـ 21 نقطة رئيسية لكل يد، وهي مصممة لمهام تقدير الوضعية.
  • Dog-pose: مجموعة بيانات شاملة تضم ما يقرب من 6000 صورة تركز على الكلاب، مع تعليقات توضيحية لـ 24 نقطة رئيسية لكل كلب، وهي مصممة خصيصًا لمهام تقدير الوضعية.

التصنيف

Image classification هي مهمة رؤية حاسوبية تتضمن تصنيف صورة إلى فئة أو أكثر من الفئات المحددة مسبقًا بناءً على محتواها المرئي.

  • Caltech 101: مجموعة بيانات تحتوي على صور لـ 101 فئة كائن لمهام تصنيف الصور.
  • Caltech 256: نسخة موسعة من Caltech 101 مع 256 فئة كائن وصور أكثر تحديًا.
  • CIFAR-10: مجموعة بيانات تتكون من 60 ألف صورة ملونة بحجم 32 × 32 في 10 فئات، مع 6 آلاف صورة لكل فئة.
  • CIFAR-100: نسخة موسعة من CIFAR-10 مع 100 فئة كائن و 600 صورة لكل فئة.
  • Fashion-MNIST: مجموعة بيانات تتكون من 70,000 صورة ذات تدرج رمادي لـ 10 فئات أزياء لمهام تصنيف الصور.
  • ImageNet: هي مجموعة بيانات واسعة النطاق للكشف عن الأجسام وتصنيف الصور تحتوي على أكثر من 14 مليون صورة و 20,000 فئة.
  • ImageNet-10: هي مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات لإجراء التجارب والاختبارات بشكل أسرع.
  • Imagenette: هي مجموعة فرعية أصغر من ImageNet تحتوي على 10 فئات يسهل تمييزها للتدريب والاختبار بشكل أسرع.
  • Imagewoof: هي مجموعة فرعية أكثر تحديًا من ImageNet تحتوي على 10 فئات لسلالات الكلاب لمهام تصنيف الصور.
  • MNIST: هي مجموعة بيانات تتكون من 70,000 صورة ذات تدرج رمادي لأرقام مكتوبة بخط اليد لمهام تصنيف الصور.
  • MNIST160: هي أول 8 صور من كل فئة من فئات MNIST من مجموعة بيانات MNIST. تحتوي مجموعة البيانات على 160 صورة إجمالاً.

مربعات الإحاطة الموجهة (OBB)

الصناديق المحيطة الموجهة (OBB) هي طريقة في رؤية الكمبيوتر لاكتشاف الكائنات الزاوية في الصور باستخدام صناديق محيطة مدورة، وغالبًا ما يتم تطبيقها على الصور الجوية وصور الأقمار الصناعية. على عكس الصناديق المحيطة التقليدية، يمكن لـ OBB أن تناسب بشكل أفضل الكائنات في اتجاهات مختلفة.

  • DOTA-v2: هي مجموعة بيانات شائعة للصور الجوية OBB تحتوي على 1.7 مليون حالة و 11,268 صورة.
  • DOTA8: هي مجموعة فرعية أصغر من أول 8 صور من مجموعة DOTAv1 المقسمة، 4 للتدريب و 4 للتحقق من الصحة، وهي مناسبة للاختبارات السريعة.

تتبع الأجسام المتعددة

تتبع الأجسام المتعددة هو تقنية رؤية حاسوبية تتضمن اكتشاف وتتبع أجسام متعددة بمرور الوقت في تسلسل فيديو. توسع هذه المهمة اكتشاف الأجسام عن طريق الحفاظ على هويات متسقة للأجسام عبر الإطارات.

  • Argoverse: هي مجموعة بيانات تحتوي على بيانات تتبع ثلاثية الأبعاد والتنبؤ بالحركة من البيئات الحضرية مع تع annotations غنية لمهام تتبع الأجسام المتعددة.
  • VisDrone: مجموعة بيانات تحتوي على بيانات الكشف عن الأجسام وتتبع الأجسام المتعددة من الصور التي تم التقاطها بواسطة الطائرات بدون طيار مع أكثر من 10 آلاف صورة وتسلسل فيديو.

المساهمة بمجموعات بيانات جديدة

يتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات لضمان توافقها جيدًا مع البنية التحتية الحالية. فيما يلي الخطوات الضرورية:



شاهد: كيفية المساهمة في مجموعات بيانات Ultralytics 🚀

خطوات المساهمة بمجموعة بيانات جديدة

  1. تجميع الصور: اجمع الصور التي تنتمي إلى مجموعة البيانات. يمكن جمع هذه الصور من مصادر مختلفة، مثل قواعد البيانات العامة أو مجموعتك الخاصة.
  2. توصيف الصور: قم بتوصيف هذه الصور باستخدام مربعات محيطة أو مقاطع أو نقاط رئيسية، اعتمادًا على المهمة.
  3. تصدير التوصيفات: قم بتحويل هذه التوصيفات إلى YOLO *.txt تنسيق الملف الذي تدعمه Ultralytics.
  4. تنظيم مجموعة البيانات: رتب مجموعة البيانات الخاصة بك في هيكل المجلد الصحيح. يجب أن يكون لديك train/ و val/ أدلة ذات مستوى أعلى، وداخل كل منها، images/ و labels/ دليل فرعي.

    dataset/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── val/
        ├── images/
        └── labels/
    
  5. إنشاء data.yaml ملف: في الدليل الجذر لمجموعة البيانات الخاصة بك، قم بإنشاء data.yaml ملف يصف مجموعة البيانات والفئات والمعلومات الضرورية الأخرى.

  6. تحسين الصور (اختياري): إذا كنت ترغب في تقليل حجم مجموعة البيانات لمعالجة أكثر كفاءة، يمكنك تحسين الصور باستخدام الكود أدناه. هذا ليس مطلوبًا، ولكنه مُوصى به لأحجام مجموعات البيانات الأصغر وسرعات التنزيل الأسرع.
  7. ضغط مجموعة البيانات: قم بضغط مجلد مجموعة البيانات بأكمله في ملف مضغوط.
  8. توثيق وطلب سحب (PR): أنشئ صفحة توثيق تصف مجموعة البيانات الخاصة بك وكيف تتناسب مع الإطار الحالي. بعد ذلك، أرسل طلب سحب (PR). ارجع إلى إرشادات المساهمة في Ultralytics لمزيد من التفاصيل حول كيفية إرسال طلب سحب.

مثال على التعليمات البرمجية لتحسين مجموعة البيانات وضغطها

تحسين وضغط مجموعة البيانات

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

باتباع هذه الخطوات، يمكنك المساهمة بمجموعة بيانات جديدة تتكامل بشكل جيد مع هيكل Ultralytics الحالي.

الأسئلة الشائعة

ما هي مجموعات البيانات التي تدعمها Ultralytics للكشف عن الأجسام؟

تدعم Ultralytics مجموعة واسعة من مجموعات البيانات لـ اكتشاف الكائنات، بما في ذلك:

  • COCO: مجموعة بيانات واسعة النطاق لاكتشاف الكائنات وتجزئتها وتسميتها مع 80 فئة كائن.
  • LVIS: مجموعة بيانات واسعة النطاق مع 1203 فئة كائن، مصممة لاكتشاف الكائنات وتجزئتها بشكل أكثر دقة.
  • Argoverse: مجموعة بيانات تحتوي على بيانات تتبع ثلاثي الأبعاد والتنبؤ بالحركة من البيئات الحضرية مع تعليقات توضيحية غنية.
  • VisDrone: مجموعة بيانات مع بيانات اكتشاف الكائنات وتتبع الكائنات المتعددة من الصور الملتقطة بواسطة الطائرات بدون طيار.
  • SKU-110K: تتميز باكتشاف الكائنات الكثيفة في بيئات البيع بالتجزئة مع أكثر من 11 ألف صورة.

تسهل مجموعات البيانات هذه تدريب نماذج Ultralytics YOLO قوية لمختلف تطبيقات الكشف عن الأجسام.

كيف يمكنني المساهمة بمجموعة بيانات جديدة في Ultralytics؟

تتضمن المساهمة بمجموعة بيانات جديدة عدة خطوات:

  1. جمع الصور: جمع الصور من قواعد البيانات العامة أو المجموعات الشخصية.
  2. تسمية الصور: تطبيق مربعات إحاطة أو أجزاء أو نقاط رئيسية، اعتمادًا على المهمة.
  3. تصدير التوصيفات: تحويل التسميات التوضيحية إلى YOLO *.txt صيغة.
  4. تنظيم مجموعة البيانات: استخدم هيكل المجلد مع train/ و val/ الدلائل، يحتوي كل منها على images/ و labels/ الدلائل الفرعية.
  5. إنشاء data.yaml ملف: قم بتضمين أوصاف مجموعة البيانات والفئات والمعلومات الأخرى ذات الصلة.
  6. تحسين الصور (اختياري): تقليل حجم مجموعة البيانات لتحقيق الكفاءة.
  7. ضغط مجموعة البيانات: ضغط مجموعة البيانات في ملف مضغوط.
  8. توثيق وطلب سحب (PR): صف مجموعة البيانات الخاصة بك وأرسل طلب سحب باتباع إرشادات المساهمة في Ultralytics.

تفضل بزيارة المساهمة بمجموعات بيانات جديدة للحصول على دليل شامل.

لماذا يجب علي استخدام Ultralytics HUB لمجموعة البيانات الخاصة بي؟

يوفر Ultralytics HUB ميزات قوية لإدارة مجموعات البيانات وتحليلها، بما في ذلك:

  • إدارة سلسة لمجموعات البيانات: قم بتحميل وتنظيم وإدارة مجموعات البيانات الخاصة بك في مكان واحد.
  • التكامل الفوري للتدريب: استخدم مجموعات البيانات التي تم تحميلها مباشرة لتدريب النموذج دون إعداد إضافي.
  • أدوات التصور: استكشف وتصور صور مجموعة البيانات والتعليقات التوضيحية الخاصة بك.
  • تحليل مجموعة البيانات: احصل على رؤى حول توزيع وخصائص مجموعة البيانات الخاصة بك.

تعمل المنصة على تبسيط عملية الانتقال من إدارة مجموعة البيانات إلى تدريب النموذج، مما يجعل العملية بأكملها أكثر كفاءة. تعرف على المزيد حول مجموعات بيانات Ultralytics HUB.

ما هي الميزات الفريدة لنماذج Ultralytics YOLO للرؤية الحاسوبية؟

توفر نماذج Ultralytics YOLO العديد من الميزات الفريدة لمهام الرؤية الحاسوبية:

  • أداء في الوقت الفعلي: قدرات استدلال وتدريب عالية السرعة للتطبيقات الحساسة للوقت.
  • تنوع الاستخدام: دعم مهام الكشف والتجزئة والتصنيف وتقدير الوضعية في إطار عمل موحد.
  • نماذج مُدرَّبة مسبقًا: الوصول إلى نماذج مُدرَّبة مسبقًا عالية الأداء لمختلف التطبيقات، مما يقلل وقت التدريب.
  • دعم مجتمعي واسع: مجتمع نشط ووثائق شاملة لاستكشاف الأخطاء وإصلاحها والتطوير.
  • سهولة التكامل: واجهة برمجة تطبيقات (API) بسيطة للتكامل مع المشاريع وسير العمل الحالية.

اكتشف المزيد حول نماذج YOLO في صفحة نماذج Ultralytics.

كيف يمكنني تحسين مجموعة البيانات وضغطها باستخدام أدوات Ultralytics؟

لتحسين مجموعة بيانات وضغطها باستخدام أدوات Ultralytics، اتبع مثال التعليمات البرمجية التالي:

تحسين وضغط مجموعة البيانات

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

تساعد هذه العملية على تقليل حجم مجموعة البيانات لتخزين أكثر كفاءة وسرعات تنزيل أسرع. تعرف على المزيد حول كيفية تحسين مجموعة البيانات وضغطها.



📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات