تخطي إلى المحتوى

مجموعة بيانات CIFAR-10

مجموعة بيانات CIFAR-10 (المعهد الكندي للأبحاث المتقدمة) هي عبارة عن مجموعة من الصور المستخدمة على نطاق واسع في التعلم الآلي وخوارزميات رؤية الكمبيوتر. تم تطويره بواسطة باحثين في معهد CIFAR ويتكون من 60,000 صورة ملونة بحجم 32 × 32 في 10 فئات مختلفة.



شاهد: كيفية تدريب تصنيف الصور نموذج مع مجموعة بيانات CIFAR-10 باستخدام Ultralytics YOLO11

الميزات الرئيسية

  • تتكون مجموعة بيانات CIFAR-10 من 60,000 صورة، مقسمة إلى 10 فئات.
  • تحتوي كل فئة على 6000 صورة، مقسمة إلى 5000 للتدريب و 1000 للاختبار.
  • الصور ملونة وبحجم 32 × 32 بكسل.
  • تمثل الفئات العشر المختلفة الطائرات والسيارات والطيور والقطط والغزلان والكلاب والضفادع والخيول والسفن والشاحنات.
  • يشيع استخدام CIFAR-10 للتدريب والاختبار في مجال تعلم الآلة ورؤية الكمبيوتر.

هيكل مجموعة البيانات

تنقسم مجموعة بيانات CIFAR-10 إلى مجموعتين فرعيتين:

  1. مجموعة التدريب: تحتوي هذه المجموعة الفرعية على 50,000 صورة تستخدم لتدريب نماذج تعلم الآلة.
  2. مجموعة الاختبار: تتكون هذه المجموعة الفرعية من 10,000 صورة تستخدم لاختبار وتقييم النماذج المدربة.

التطبيقات

تستخدم مجموعة بيانات CIFAR-10 على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور، مثل الشبكات العصبية التلافيفية (CNNs) و آلات المتجهات الداعمة (SVMs) والعديد من خوارزميات التعلم الآلي الأخرى. إن تنوع مجموعة البيانات من حيث الفئات ووجود الصور الملونة يجعلها مجموعة بيانات شاملة للبحث والتطوير في مجال التعلم الآلي ورؤية الكمبيوتر.

الاستخدام

لتدريب نموذج YOLO على مجموعة بيانات CIFAR-10 لعدد 100 حقبة (epoch) بحجم صورة 32x32، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

عينات من الصور والشروحات التوضيحية

تحتوي مجموعة بيانات CIFAR-10 على صور ملونة لأشياء مختلفة، مما يوفر مجموعة بيانات منظمة بشكل جيد لمهام تصنيف الصور. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

نموذج صورة من مجموعة البيانات

يعرض المثال تنوع وتعقيد الكائنات في مجموعة بيانات CIFAR-10، مما يسلط الضوء على أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج قوية لتصنيف الصور.

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات CIFAR-10 في عملك البحثي أو التطويري، فيرجى الاستشهاد بالورقة التالية:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

نود أن نعرب عن تقديرنا لأليكس كريزيفسكي لإنشاء وصيانة مجموعة بيانات CIFAR-10 كمورد قيم لمجتمع تعلم الآلة وأبحاث رؤية الحاسوب. لمزيد من المعلومات حول مجموعة بيانات CIFAR-10 ومنشئها، تفضل بزيارة موقع مجموعة بيانات CIFAR-10.

الأسئلة الشائعة

كيف يمكنني تدريب نموذج YOLO على مجموعة بيانات CIFAR-10؟

لتدريب نموذج YOLO على مجموعة بيانات CIFAR-10 باستخدام Ultralytics، يمكنك اتباع الأمثلة المقدمة لكل من Python و CLI. إليك مثال أساسي لتدريب النموذج الخاص بك لعدد 100 حقبة (epoch) بحجم صورة 32x32 بكسل:

مثال

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

لمزيد من التفاصيل، يرجى الرجوع إلى صفحة تدريب النموذج.

ما هي الميزات الرئيسية لمجموعة بيانات CIFAR-10؟

تتكون مجموعة بيانات CIFAR-10 من 60,000 صورة ملونة مقسمة إلى 10 فئات. تحتوي كل فئة على 6000 صورة، مع 5000 صورة للتدريب و 1000 للاختبار. يبلغ حجم الصور 32 × 32 بكسل وتختلف عبر الفئات التالية:

  • الطائرات
  • سيارات
  • الطيور
  • قطط
  • غزلان
  • كلاب
  • ضفادع
  • خيول
  • السفن
  • شاحنات

تعتبر هذه المجموعة المتنوعة من البيانات ضرورية لتدريب نماذج تصنيف الصور في مجالات مثل التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات، قم بزيارة أقسام CIFAR-10 حول هيكل مجموعة البيانات و التطبيقات.

لماذا نستخدم مجموعة بيانات CIFAR-10 لمهام تصنيف الصور؟

تعتبر مجموعة بيانات CIFAR-10 معيارًا ممتازًا لتصنيف الصور نظرًا لتنوعها وهيكلها. يحتوي على مزيج متوازن من 60,000 صورة مصنفة عبر 10 فئات مختلفة، مما يساعد في تدريب نماذج قوية ومعممة. يتم استخدامه على نطاق واسع لتقييم نماذج التعلم العميق، بما في ذلك الشبكات العصبية التلافيفية (CNNs) وخوارزميات التعلم الآلي الأخرى. مجموعة البيانات صغيرة نسبيًا، مما يجعلها مناسبة للتجريب السريع وتطوير الخوارزميات. استكشف تطبيقاتها العديدة في قسم التطبيقات.

كيف يتم تنظيم مجموعة بيانات CIFAR-10؟

تم تنظيم مجموعة بيانات CIFAR-10 في مجموعتين فرعيتين رئيسيتين:

  1. مجموعة التدريب: تحتوي على 50,000 صورة تستخدم لتدريب نماذج تعلم الآلة.
  2. مجموعة الاختبار: تتكون من 10,000 صورة لاختبار وتقييم النماذج المدربة.

تتكون كل مجموعة فرعية من صور مصنفة إلى 10 فئات، مع توفر الشروح الخاصة بها بسهولة لتدريب وتقييم النموذج. لمزيد من المعلومات التفصيلية، راجع قسم هيكل مجموعة البيانات.

كيف يمكنني الاستشهاد بمجموعة بيانات CIFAR-10 في بحثي؟

إذا كنت تستخدم مجموعة بيانات CIFAR-10 في مشاريع البحث أو التطوير الخاصة بك، فتأكد من الاستشهاد بالورقة التالية:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

يساعد تقدير جهود مُنشئي مجموعة البيانات في دعم استمرار البحث والتطوير في هذا المجال. لمزيد من التفاصيل، راجع قسم الاقتباسات والإقرارات.

ما هي بعض الأمثلة العملية لاستخدام مجموعة بيانات CIFAR-10؟

غالبًا ما تستخدم مجموعة بيانات CIFAR-10 لتدريب نماذج تصنيف الصور، مثل الشبكات العصبية التلافيفية (CNNs) وآلات المتجهات الداعمة (SVMs). يمكن استخدام هذه النماذج في مهام رؤية الكمبيوتر المختلفة بما في ذلك اكتشاف الكائنات و التعرف على الصور والوسم التلقائي. للاطلاع على بعض الأمثلة العملية، تحقق من مقتطفات التعليمات البرمجية في قسم الاستخدام.



📅 تم الإنشاء منذ سنة واحدة ✏️ تم التحديث منذ 4 أشهر

تعليقات