تخطي إلى المحتوى

مجموعة بيانات Dog-Pose

مقدمة

مجموعة بيانات Ultralytics Dog-pose هي مجموعة بيانات عالية الجودة وشاملة مصممة خصيصًا لتقدير النقاط الرئيسية للكلاب. مع 6,773 صورة تدريب و 1,703 صورة اختبار، توفر مجموعة البيانات هذه أساسًا متينًا لتدريب نماذج قوية لتقدير الوضع.



شاهد: كيفية تدريب Ultralytics YOLO11 على مجموعة بيانات Stanford لتقدير وضعية الكلاب | برنامج تعليمي خطوة بخطوة 🚀

تتضمن كل صورة مشروحة 24 نقطة رئيسية مع 3 أبعاد لكل نقطة رئيسية (x، y، visibility)، مما يجعلها موردًا قيمًا للبحث والتطوير المتقدم في مجال رؤية الكمبيوتر.

صورة عرض Ultralytics لوضعية الكلب

مجموعة البيانات هذه مخصصة للاستخدام مع Ultralytics HUB و YOLO11.

ملف YAML لمجموعة البيانات

يتم استخدام ملف YAML (وهي لغة ترميز أخرى) لتحديد تكوين مجموعة البيانات. يتضمن المسارات وتفاصيل النقاط الرئيسية والمعلومات الأخرى ذات الصلة. في حالة مجموعة بيانات Dog-pose، فإن dog-pose.yaml متاح على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

الاستخدام

لتدريب نموذج YOLO11n-pose على مجموعة بيانات Dog-pose لعدد 100 حقبة (epoch) بحجم صورة 640، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالحجج المتاحة، ارجع إلى صفحة تدريب النموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

عينات من الصور والشروحات التوضيحية

فيما يلي بعض الأمثلة لصور من مجموعة بيانات Dog-pose، بالإضافة إلى الشروح التوضيحية المقابلة لها:

نموذج صورة من مجموعة البيانات

  • صورة مجمعة: توضح هذه الصورة دفعة تدريبية تتكون من صور مجموعة بيانات مجمعة. التجميع هو أسلوب يستخدم أثناء التدريب يجمع بين صور متعددة في صورة واحدة لزيادة تنوع الكائنات والمشاهد داخل كل دفعة تدريبية. يساعد هذا في تحسين قدرة النموذج على التعميم على أحجام الكائنات ونسب العرض إلى الارتفاع والسياقات المختلفة.

يُظهر هذا المثال تنوع وتعقيد الصور في مجموعة بيانات وضعيات الكلاب (Dog-pose)، بالإضافة إلى فوائد استخدام تقنية الفسيفساء خلال عملية التدريب.

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات Dog-pose في بحثك أو عملك التطويري، فيرجى الاستشهاد بالورقة التالية:

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

نود أن نعرب عن تقديرنا لفريق ستانفورد لإنشاء وصيانة هذا المورد القيم لمجتمع رؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات وضعية الكلاب ومنشئيها، تفضل بزيارة موقع مجموعة بيانات كلاب ستانفورد.

الأسئلة الشائعة

ما هي مجموعة بيانات Dog-pose، وكيف يتم استخدامها مع Ultralytics YOLO11؟

تتميز مجموعة بيانات Dog-Pose باحتوائها على 6,773 صورة تدريب و 1,703 صورة اختبار مُعلّمة بـ 24 نقطة رئيسية لتقدير وضعية الكلاب. وهي مُصممة لتدريب نماذج Ultralytics YOLO11 والتحقق من صحتها، ودعم تطبيقات مثل تحليل سلوك الحيوانات، ومراقبة الحيوانات الأليفة، والدراسات البيطرية. إن التعليقات التوضيحية الشاملة لمجموعة البيانات تجعلها مثالية لتطوير نماذج دقيقة لتقدير وضعية الكلاب.

كيف يمكنني تدريب نموذج YOLO11 باستخدام مجموعة بيانات Dog-pose في Ultralytics؟

لتدريب نموذج YOLO11n-pose على مجموعة بيانات Dog-pose لعدد 100 حقبة (epoch) بحجم صورة 640، اتبع هذه الأمثلة:

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

للحصول على قائمة شاملة بحجج التدريب، راجع صفحة تدريب النموذج.

ما هي فوائد استخدام مجموعة بيانات Dog-pose؟

توفر مجموعة بيانات وضعية الكلب عدة مزايا:

مجموعة بيانات كبيرة ومتنوعة: مع أكثر من 8400 صورة، فإنها توفر بيانات كبيرة تغطي مجموعة واسعة من أوضاع وسلالات وسياقات الكلاب، مما يتيح تدريب وتقييم نموذج قوي.

شروحات تفصيلية للنقاط الرئيسية: تتضمن كل صورة 24 نقطة رئيسية مع 3 أبعاد لكل نقطة رئيسية (x، y، الرؤية)، مما يوفر شروحات دقيقة لتدريب نماذج دقيقة للكشف عن الوضعيات.

سيناريوهات العالم الحقيقي: تتضمن صورًا من بيئات متنوعة، مما يعزز قدرة النموذج على التعميم على تطبيقات العالم الحقيقي مثل مراقبة الحيوانات الأليفة وتحليل السلوك.

ميزة التعلم بالنقل: تعمل مجموعة البيانات بشكل جيد مع تقنيات التعلم بالنقل، مما يسمح للنماذج المدربة مسبقًا على مجموعات بيانات وضعية الإنسان بالتكيف مع الميزات الخاصة بالكلاب.

لمعرفة المزيد حول ميزاته واستخدامه، راجع قسم مقدمة مجموعة البيانات.

كيف تفيد عملية الفسيفساء عملية تدريب YOLO11 باستخدام مجموعة بيانات Dog-pose؟

تدمج عملية الفسيفساء، كما هو موضح في الصور النموذجية من مجموعة بيانات Dog-pose، صورًا متعددة في صورة مركبة واحدة، مما يثري تنوع الكائنات والمشاهد في كل دفعة تدريب. توفر هذه التقنية العديد من الفوائد:

  • يزيد من تنوع أوضاع الكلاب وأحجامها وخلفياتها في كل دفعة
  • يحسن قدرة النموذج على اكتشاف الكلاب في سياقات ومقاييس مختلفة
  • يحسن التعميم من خلال تعريض النموذج لأنماط مرئية أكثر تنوعًا
  • يقلل من التجاوز عن طريق إنشاء تركيبات جديدة من أمثلة التدريب

تؤدي هذه الطريقة إلى نماذج أكثر قوة تعمل بشكل أفضل في سيناريوهات العالم الحقيقي. للحصول على سبيل المثال للصور، ارجع إلى قسم نماذج الصور والشروحات التوضيحية.

أين يمكنني العثور على ملف YAML لمجموعة بيانات Dog-pose وكيف يمكنني استخدامه؟

يمكن العثور على ملف YAML لمجموعة بيانات Dog-pose في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. يحدد هذا الملف تكوين مجموعة البيانات، بما في ذلك المسارات والفئات وتفاصيل النقاط الرئيسية والمعلومات الأخرى ذات الصلة. يحدد YAML 24 نقطة رئيسية مع 3 أبعاد لكل نقطة رئيسية، مما يجعلها مناسبة لمهام تقدير الوضع التفصيلية.

لاستخدام هذا الملف مع نصوص تدريب YOLO11، ما عليك سوى الإشارة إليه في أمر التدريب الخاص بك كما هو موضح في قسم الاستخدام. سيتم تنزيل مجموعة البيانات تلقائيًا عند استخدامها لأول مرة، مما يجعل الإعداد مباشرًا.

لمزيد من الأسئلة الشائعة والوثائق التفصيلية، قم بزيارة وثائق Ultralytics.



📅 تم إنشاؤه منذ 8 أشهر ✏️ تم التحديث منذ شهر واحد

تعليقات