تخطي إلى المحتوى

مجموعة بيانات ImageNet10

تُعد مجموعة بيانات ImageNet10 مجموعة فرعية صغيرة الحجم من قاعدة بيانات ImageNet، طورتها Ultralytics وهي مصممة لاختبارات CI وعمليات التحقق من السلامة والاختبار السريع لخطوط أنابيب التدريب. تتكون مجموعة البيانات هذه من الصورة الأولى في مجموعة التدريب والصورة الأولى من مجموعة التحقق من الصحة للفئات العشر الأولى في ImageNet. على الرغم من أنها أصغر بكثير، إلا أنها تحتفظ ببنية وتنوع مجموعة بيانات ImageNet الأصلية.

الميزات الرئيسية

  • ImageNet10 هي نسخة مضغوطة من ImageNet، تحتوي على 20 صورة تمثل أول 10 فئات من مجموعة البيانات الأصلية.
  • تم تنظيم مجموعة البيانات وفقًا لتسلسل WordNet الهرمي، مما يعكس هيكل مجموعة بيانات ImageNet الكاملة.
  • إنه مثالي لاختبارات التكامل المستمر (CI)، وفحوصات السلامة، والاختبار السريع لخطوط أنابيب التدريب في مهام الرؤية الحاسوبية.
  • على الرغم من أنه غير مصمم ليكون معيارًا لتقييم النماذج، إلا أنه يمكن أن يوفر مؤشرًا سريعًا للوظائف الأساسية للنموذج وصحته.

هيكل مجموعة البيانات

تتشابه مجموعة بيانات ImageNet10 مع ImageNet الأصلية، حيث يتم تنظيمها باستخدام التسلسل الهرمي لـ WordNet. يتم وصف كل فئة من الفئات العشر في ImageNet10 بواسطة synset (مجموعة من المصطلحات المترادفة). يتم شرح الصور الموجودة في ImageNet10 بواحد أو أكثر من synsets، مما يوفر مصدرًا مضغوطًا لاختبار النماذج للتعرف على الكائنات المختلفة وعلاقاتها.

التطبيقات

تعد مجموعة بيانات ImageNet10 مفيدة للاختبار السريع وتصحيح أخطاء نماذج وخطوط رؤية الكمبيوتر. يسمح حجمها الصغير بالتكرار السريع، مما يجعلها مثالية لاختبارات التكامل المستمر والفحوصات المنطقية. يمكن استخدامه أيضًا للاختبار الأولي السريع للنماذج الجديدة أو التغييرات في النماذج الحالية قبل الانتقال إلى الاختبار واسع النطاق باستخدام مجموعة بيانات ImageNet الكاملة.

الاستخدام

لاختبار نموذج التعلم العميق على مجموعة بيانات ImageNet10 بحجم صورة 224 × 224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالحجج المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال للاختبار

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

عينات من الصور والشروحات التوضيحية

تحتوي مجموعة بيانات ImageNet10 على مجموعة فرعية من الصور من مجموعة بيانات ImageNet الأصلية. تم اختيار هذه الصور لتمثيل الفئات العشر الأولى في مجموعة البيانات، مما يوفر مجموعة بيانات متنوعة ولكنها مضغوطة للاختبار والتقييم السريعين.

صور عينة لمجموعة البيانات

يُظهر هذا المثال تنوع وتعقيد الصور في مجموعة بيانات ImageNet10، مع تسليط الضوء على فائدتها في إجراء فحوصات التحقق السريع واختبار نماذج رؤية الكمبيوتر.

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات ImageNet10 في بحثك أو عملك التطويري، فيرجى الاستشهاد بورقة ImageNet الأصلية:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

نود أن نعرب عن تقديرنا لفريق ImageNet، بقيادة Olga Russakovsky و Jia Deng و Li Fei-Fei، لإنشاء مجموعة بيانات ImageNet والحفاظ عليها. تعد مجموعة بيانات ImageNet10، على الرغم من كونها مجموعة فرعية مضغوطة، موردًا قيمًا للاختبار السريع وتصحيح الأخطاء في مجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومنشئيها، تفضل بزيارة موقع ImageNet.

الأسئلة الشائعة

ما هي مجموعة بيانات ImageNet10 وكيف تختلف عن مجموعة بيانات ImageNet الكاملة؟

تُعد مجموعة بيانات ImageNet10 مجموعة فرعية مضغوطة من قاعدة بيانات ImageNet الأصلية، والتي أنشأتها Ultralytics لإجراء اختبارات CI السريعة وعمليات التحقق من السلامة وتقييمات خطوط أنابيب التدريب. تشتمل ImageNet10 على 20 صورة فقط، تمثل الصورة الأولى في مجموعات التدريب والتحقق من الصحة للفئات العشر الأولى في ImageNet. على الرغم من صغر حجمها، إلا أنها تحافظ على بنية وتنوع مجموعة البيانات الكاملة، مما يجعلها مثالية للاختبار السريع ولكن ليس لتقييم أداء النماذج.

كيف يمكنني استخدام مجموعة بيانات ImageNet10 لاختبار نموذج التعلم العميق الخاص بي؟

لاختبار نموذج التعلم العميق الخاص بك على مجموعة بيانات ImageNet10 بحجم صورة 224 × 224، استخدم مقتطفات التعليمات البرمجية التالية.

مثال للاختبار

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

راجع صفحة التدريب للحصول على قائمة شاملة بالحجج المتاحة.

لماذا يجب عليّ استخدام مجموعة بيانات ImageNet10 لاختبارات التكامل المستمر (CI) والتحقق من السلامة؟

تم تصميم مجموعة بيانات ImageNet10 خصيصًا لاختبارات التكامل المستمر، وفحوصات السلامة، والتقييمات السريعة في خطوط أنابيب التعلم العميق. يسمح حجمها الصغير بالتكرار والاختبار السريعين، مما يجعلها مثالية لعمليات التكامل المستمر حيث السرعة أمر بالغ الأهمية. من خلال الحفاظ على التعقيد الهيكلي وتنوع مجموعة بيانات ImageNet الأصلية، توفر ImageNet10 مؤشرًا موثوقًا للوظائف الأساسية للنموذج وصحته دون الحاجة إلى معالجة مجموعة بيانات كبيرة.

ما هي الميزات الرئيسية لمجموعة بيانات ImageNet10؟

تتميز مجموعة بيانات ImageNet10 بعدة ميزات رئيسية:

  • حجم صغير: مع 20 صورة فقط، فإنه يسمح بإجراء اختبارات وتصحيح الأخطاء بسرعة.
  • تنظيم مهيكل: يتبع تسلسل WordNet الهرمي، على غرار مجموعة بيانات ImageNet الكاملة.
  • CI وعمليات التحقق من السلامة: مناسبة بشكل مثالي لاختبارات التكامل المستمر وعمليات التحقق من السلامة.
  • ليس لغرض القياس: على الرغم من أنه مفيد لتقييمات النموذج السريعة، إلا أنه غير مصمم لإجراء قياسات شاملة.

كيف تتم مقارنة ImageNet10 بمجموعات البيانات الصغيرة الأخرى مثل ImageNette؟

في حين أن كلاً من ImageNet10 و ImageNette هما مجموعتان فرعيتان من ImageNet، إلا أنهما تخدمان أغراضًا مختلفة. تحتوي ImageNet10 على 20 صورة فقط (2 لكل فئة) من أول 10 فئات من ImageNet، مما يجعلها خفيفة الوزن للغاية لاختبارات CI والتحقق السريع من السلامة. على النقيض من ذلك، تحتوي ImageNette على آلاف الصور عبر 10 فئات يسهل تمييزها، مما يجعلها أكثر ملاءمة لتدريب وتطوير النماذج الفعلية. تم تصميم ImageNet10 للتحقق من وظائف خطوط المعالجة، في حين أن ImageNette أفضل لإجراء تجارب تدريب ذات مغزى ولكنها أسرع من ImageNet الكاملة.



📅 تم الإنشاء منذ سنة واحدة ✏️ تم التحديث منذ 4 أشهر

تعليقات