تخطي إلى المحتوى

مجموعة بيانات ImageWoof

مجموعة بيانات ImageWoof هي مجموعة فرعية من ImageNet تتكون من 10 فئات يصعب تصنيفها، لأنها جميعًا سلالات كلاب. تم إنشاؤها كمهمة أكثر صعوبة لخوارزميات تصنيف الصور لحلها، بهدف تشجيع تطوير نماذج أكثر تقدمًا.

الميزات الرئيسية

  • تحتوي ImageWoof على صور لـ 10 سلالات مختلفة من الكلاب: Australian Terrier، و Border Terrier، و Samoyed، و Beagle، و Shih-Tzu، و English Foxhound، و Rhodesian Ridgeback، و Dingo، و Golden Retriever، و Old English Sheepdog.
  • توفر مجموعة البيانات صورًا بدقة متنوعة (حجم كامل، 320 بكسل، 160 بكسل)، مما يلبي القدرات الحسابية المختلفة والاحتياجات البحثية.
  • يتضمن أيضًا إصدارًا مع تسميات مشوشة، مما يوفر سيناريو أكثر واقعية حيث قد لا تكون التسميات موثوقة دائمًا.

هيكل مجموعة البيانات

يعتمد هيكل مجموعة بيانات ImageWoof على فئات سلالات الكلاب، حيث يكون لكل سلالة دليل خاص بها للصور. على غرار مجموعات بيانات التصنيف الأخرى، فإنه يتبع تنسيق الدليل المنفصل مع مجلدات منفصلة لمجموعات التدريب والتحقق.

التطبيقات

تُستخدم مجموعة بيانات ImageWoof على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور، خاصةً عندما يتعلق الأمر بالفئات الأكثر تعقيدًا والمتشابهة. يكمن تحدي مجموعة البيانات في الاختلافات الدقيقة بين سلالات الكلاب، مما يدفع حدود أداء النموذج وتعميمه. إنها ذات قيمة خاصة من أجل:

  • قياس أداء نموذج التصنيف على فئات دقيقة.
  • اختبار قوة النموذج ضد الفئات المتشابهة
  • تطوير الخوارزميات التي يمكنها تمييز الاختلافات البصرية الدقيقة
  • تقييم قدرات التعلم بالنقل من المجالات العامة إلى المحددة

الاستخدام

لتدريب نموذج CNN على مجموعة بيانات ImageWoof لـ 100 حقبة بحجم صورة 224 × 224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالحجج المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

متغيرات مجموعة البيانات

تأتي مجموعة بيانات ImageWoof بثلاثة أحجام مختلفة لتلبية الاحتياجات البحثية والقدرات الحسابية المتنوعة:

  1. حجم كامل (imagewoof): هذه هي النسخة الأصلية من مجموعة بيانات ImageWoof. وهي تحتوي على صور كاملة الحجم ومثالية للتدريب النهائي وقياس أداء.

  2. حجم متوسط ​​(imagewoof320): يحتوي هذا الإصدار على صور تم تغيير حجمها بحيث يبلغ الحد الأقصى لطول الحافة 320 بكسل. إنه مناسب للتدريب بشكل أسرع دون التضحية بأداء النموذج بشكل كبير.

  3. حجم صغير (imagewoof160): يحتوي هذا الإصدار على صور تم تغيير حجمها بحيث يكون الحد الأقصى لطول الحافة 160 بكسل. إنه مصمم للنماذج الأولية السريعة والتجريب حيث تكون سرعة التدريب أولوية.

لاستخدام هذه المتغيرات في التدريب الخاص بك، ما عليك سوى استبدال 'imagewoof' في وسيطة مجموعة البيانات بـ 'imagewoof320' أو 'imagewoof160'. على سبيل المثال:

مثال

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

من المهم ملاحظة أن استخدام صور أصغر من المرجح أن يؤدي إلى أداء أقل من حيث دقة التصنيف. ومع ذلك، فهي طريقة ممتازة للتكرار بسرعة في المراحل المبكرة من تطوير النموذج والنماذج الأولية.

عينات من الصور والشروحات التوضيحية

تحتوي مجموعة بيانات ImageWoof على صور ملونة لسلالات مختلفة من الكلاب، مما يوفر مجموعة بيانات مليئة بالتحديات لمهام تصنيف الصور. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

نموذج صورة من مجموعة البيانات

يعرض المثال الاختلافات والتشابهات الدقيقة بين سلالات الكلاب المختلفة في مجموعة بيانات ImageWoof، مما يسلط الضوء على تعقيد وصعوبة مهمة التصنيف.

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات ImageWoof في بحثك أو عملك التطويري، فيرجى التأكد من الإقرار بمنشئي مجموعة البيانات عن طريق الارتباط بـ مستودع مجموعة البيانات الرسمي.

نود أن نشكر فريق FastAI لإنشاء مجموعة بيانات ImageWoof والحفاظ عليها كمورد قيم لتعلم الآلة ومجتمع أبحاث رؤية الحاسوب. لمزيد من المعلومات حول مجموعة بيانات ImageWoof، تفضل بزيارة مستودع مجموعة بيانات ImageWoof.

الأسئلة الشائعة

ما هي مجموعة بيانات ImageWoof في Ultralytics؟

تُعد مجموعة بيانات ImageWoof مجموعة فرعية مليئة بالتحديات من ImageNet تركز على 10 سلالات معينة من الكلاب. تم إنشاؤها لتجاوز حدود نماذج تصنيف الصور، وتتميز بسلالات مثل Beagle و Shih-Tzu و Golden Retriever. تشتمل مجموعة البيانات على صور بدقة متنوعة (حجم كامل، 320 بكسل، 160 بكسل) وحتى تسميات مشوشة لسيناريوهات تدريب أكثر واقعية. هذا التعقيد يجعل ImageWoof مثالية لتطوير نماذج تعلم عميق أكثر تقدمًا.

كيف يمكنني تدريب نموذج باستخدام مجموعة بيانات ImageWoof مع Ultralytics YOLO؟

لتدريب نموذج شبكة عصبونية التفافية (CNN) على مجموعة بيانات ImageWoof باستخدام Ultralytics YOLO لـ 100 حقبة بحجم صورة 224 × 224، يمكنك استخدام الكود التالي:

مثال على التدريب

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

لمزيد من التفاصيل حول حجج التدريب المتاحة، راجع صفحة التدريب.

ما هي الإصدارات المتوفرة من مجموعة بيانات ImageWoof؟

تأتي مجموعة بيانات ImageWoof بثلاثة أحجام:

  1. حجم كامل (imagewoof): مثالي للتدريب النهائي وقياس الأداء، حيث يحتوي على صور كاملة الحجم.
  2. حجم متوسط ​​(imagewoof320): صور تم تغيير حجمها بحيث يبلغ الحد الأقصى لطول الحافة 320 بكسل، وهي مناسبة للتدريب بشكل أسرع.
  3. حجم صغير (imagewoof160): صور تم تغيير حجمها بحد أقصى لطول الحافة يبلغ 160 بكسل، وهي مثالية للنماذج الأولية السريعة.

استخدم هذه الإصدارات عن طريق استبدال 'imagewoof' في وسيطة مجموعة البيانات وفقًا لذلك. ومع ذلك، تجدر الإشارة إلى أن الصور الأصغر قد تؤدي إلى دقة تصنيف أقل ولكنها قد تكون مفيدة للتكرارات الأسرع.

كيف تفيد التصنيفات المشوشة في مجموعة بيانات ImageWoof التدريب؟

تعمل الملصقات المشوشة في مجموعة بيانات ImageWoof على محاكاة ظروف العالم الحقيقي حيث قد لا تكون الملصقات دقيقة دائمًا. يساعد تدريب النماذج باستخدام هذه البيانات على تطوير المتانة والتعميم في مهام تصنيف الصور. وهذا يهيئ النماذج للتعامل بفعالية مع البيانات الغامضة أو التي تحمل علامات خاطئة، والتي غالبًا ما تتم مواجهتها في التطبيقات العملية.

ما هي التحديات الرئيسية لاستخدام مجموعة بيانات ImageWoof؟

يكمن التحدي الأساسي لمجموعة بيانات ImageWoof في الاختلافات الدقيقة بين سلالات الكلاب التي تتضمنها. نظرًا لتركيزها على 10 سلالات وثيقة الصلة، فإن التمييز بينها يتطلب نماذج تصنيف صور أكثر تقدمًا ودقة. وهذا يجعل ImageWoof معيارًا ممتازًا لاختبار قدرات وتحسينات نماذج التعلم العميق.



📅 تم الإنشاء منذ سنة واحدة ✏️ تم التحديث منذ 4 أشهر

تعليقات