مجموعة بيانات النقاط الرئيسية لليد
مقدمة
تحتوي مجموعة بيانات النقاط الرئيسية لليد على 26,768 صورة لأيدي مُعلّمة بنقاط رئيسية، مما يجعلها مناسبة لتدريب نماذج مثل Ultralytics YOLO لمهام تقدير الوضعية. تم إنشاء التعليقات التوضيحية باستخدام مكتبة Google MediaPipe، مما يضمن دقة واتساقًا عاليين، ومجموعة البيانات متوافقة مع تنسيقات Ultralytics YOLO11.
شاهد: تقدير النقاط الرئيسية لليد باستخدام Ultralytics YOLO11 | برنامج تعليمي لتقدير وضعية يد الإنسان
معالم اليد
النقاط الرئيسية
تتضمن مجموعة البيانات نقاطًا رئيسية لاكتشاف اليد. يتم شرح النقاط الرئيسية على النحو التالي:
- المعصم
- الإبهام (4 نقاط)
- السبابة (4 نقاط)
- الإصبع الأوسط (4 نقاط)
- إصبع الخاتم (4 نقاط)
- إصبع الخنصر (4 نقاط)
تحتوي كل يد على إجمالي 21 نقطة رئيسية.
الميزات الرئيسية
- مجموعة بيانات كبيرة: 26,768 صورة مع تعليقات توضيحية لنقاط رئيسية لليد.
- توافق YOLO11: جاهز للاستخدام مع نماذج YOLO11.
- 21 نقطة رئيسية: تمثيل تفصيلي لوضعية اليد.
هيكل مجموعة البيانات
تنقسم مجموعة بيانات النقاط الرئيسية لليد إلى مجموعتين فرعيتين:
- Train: تحتوي هذه المجموعة الفرعية على 18,776 صورة من مجموعة بيانات نقاط اليد الرئيسية، مشروحة لتدريب نماذج تقدير الوضعية.
- Val: تحتوي هذه المجموعة الفرعية على 7,992 صورة يمكن استخدامها لأغراض التحقق أثناء تدريب النموذج.
التطبيقات
يمكن استخدام النقاط الرئيسية لليد من أجل التعرف على الإيماءات، و عناصر التحكم في الواقع المعزز/الواقع الافتراضي، والتحكم الروبوتي، وتحليل حركة اليد في الرعاية الصحية. ويمكن أيضًا تطبيقها في الرسوم المتحركة لالتقاط الحركة وأنظمة المصادقة البيومترية للأمان. يتيح التتبع التفصيلي لمواضع الأصابع تفاعلًا دقيقًا مع الكائنات الافتراضية وواجهات التحكم بدون لمس.
ملف YAML لمجموعة البيانات
يتم استخدام ملف YAML (وهي لغة ترميز أخرى) لتحديد تكوين مجموعة البيانات. يحتوي على معلومات حول مسارات مجموعة البيانات وفئاتها ومعلومات أخرى ذات صلة. في حالة مجموعة بيانات Hand Keypoints، فإن hand-keypoints.yaml
يتم الاحتفاظ بالملف في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.
ultralytics/cfg/datasets/hand-keypoints.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
# └── hand-keypoints ← downloads here (369 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: hand-keypoints # dataset root dir
train: images/train # train images (relative to 'path') 18776 images
val: images/val # val images (relative to 'path') 7992 images
# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
[0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]
# Classes
names:
0: hand
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip
الاستخدام
لتدريب نموذج YOLO11n-pose على مجموعة بيانات Hand Keypoints لعدد 100 حقبة (epoch) بحجم صورة 640، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالحجج المتاحة، ارجع إلى صفحة تدريب النموذج.
مثال على التدريب
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
عينات من الصور والشروحات التوضيحية
تحتوي مجموعة بيانات النقاط الرئيسية لليد على مجموعة متنوعة من الصور مع أيدي بشرية مشروحة بنقاط رئيسية. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات، جنبًا إلى جنب مع التعليقات التوضيحية المقابلة لها:
- صورة مجمعة: توضح هذه الصورة دفعة تدريبية تتكون من صور مجموعة بيانات مجمعة. التجميع هو أسلوب يستخدم أثناء التدريب يجمع بين صور متعددة في صورة واحدة لزيادة تنوع الكائنات والمشاهد داخل كل دفعة تدريبية. يساعد هذا في تحسين قدرة النموذج على التعميم على أحجام الكائنات ونسب العرض إلى الارتفاع والسياقات المختلفة.
يُظهر هذا المثال تنوع وتعقيد الصور في مجموعة بيانات نقاط المفاتيح اليدوية (Hand Keypoints)، بالإضافة إلى فوائد استخدام تقنية الفسيفساء خلال عملية التدريب.
الاقتباسات والإقرارات
إذا كنت تستخدم مجموعة بيانات hand-keypoints في بحثك أو عملك التطويري، فيرجى الإقرار بالمصادر التالية:
نود أن نشكر المصادر التالية لتقديم الصور المستخدمة في هذه المجموعة من البيانات:
تم تجميع الصور واستخدامها بموجب التراخيص الخاصة بكل منصة، ويتم توزيعها بموجب رخصة المشاع الإبداعي نَسب المُصنَّف - غير تجاري - الترخيص بالمثل 4.0 الدولية.
نود أيضًا أن نعرب عن تقديرنا لمُنشئ مجموعة البيانات هذه، Rion Dsilva، لمساهمته الكبيرة في أبحاث Vision AI.
الأسئلة الشائعة
كيف يمكنني تدريب نموذج YOLO11 على مجموعة بيانات نقاط اليد الرئيسية؟
لتدريب نموذج YOLO11 على مجموعة بيانات نقاط اليد الرئيسية، يمكنك استخدام python أو واجهة سطر الأوامر (CLI). إليك مثال لتدريب نموذج YOLO11n-pose لـ 100 حقبة بحجم صورة 640:
مثال
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
للحصول على قائمة شاملة بالحجج المتاحة، راجع صفحة التدريب الخاصة بالنموذج.
ما هي الميزات الرئيسية لمجموعة بيانات نقاط مفاتيح اليد (Hand Keypoints)؟
تم تصميم مجموعة بيانات Hand Keypoints لمهام تقدير الوضعية المتقدمة وتتضمن العديد من الميزات الرئيسية:
- مجموعة بيانات كبيرة: تحتوي على 26,768 صورة مع تعليقات توضيحية لنقاط رئيسية لليد.
- توافق YOLO11: جاهز للاستخدام مع نماذج YOLO11.
- 21 نقطة رئيسية: تمثيل تفصيلي لوضعية اليد، بما في ذلك الرسغ ومفاصل الأصابع.
لمزيد من التفاصيل، يمكنك استكشاف قسم مجموعة بيانات نقاط مفاتيح اليد.
ما هي التطبيقات التي يمكن أن تستفيد من استخدام مجموعة بيانات النقاط الرئيسية لليد؟
يمكن تطبيق مجموعة بيانات Hand Keypoints في مجالات مختلفة، بما في ذلك:
- التعرف على الإيماءات: تعزيز التفاعل بين الإنسان والحاسوب.
- عناصر التحكم في الواقع المعزز/الواقع الافتراضي: تحسين تجربة المستخدم في الواقع المعزز والواقع الافتراضي.
- التحكم الروبوتي: تمكين التحكم الدقيق في الأيدي الروبوتية.
- الرعاية الصحية: تحليل حركات اليد للتشخيصات الطبية.
- الرسوم المتحركة: التقاط الحركة لرسوم متحركة واقعية.
- المصادقة البيومترية: تعزيز أنظمة الأمان.
لمزيد من المعلومات، راجع قسم التطبيقات.
كيف يتم تنظيم مجموعة بيانات نقاط مفاتيح اليد؟
تنقسم مجموعة بيانات نقاط مفاتيح اليد إلى مجموعتين فرعيتين:
- Train: يحتوي على 18,776 صورة لتدريب نماذج تقدير الوضعية.
- Val: تحتوي على 7,992 صورة لأغراض التحقق أثناء تدريب النموذج.
يضمن هذا الهيكل عملية تدريب وتحقق شاملة. لمزيد من التفاصيل، راجع قسم هيكل مجموعة البيانات.
كيف يمكنني استخدام ملف YAML الخاص بمجموعة البيانات للتدريب؟
يتم تحديد تكوين مجموعة البيانات في ملف YAML، والذي يتضمن المسارات والفئات والمعلومات الأخرى ذات الصلة. ال hand-keypoints.yaml
يمكن العثور عليه في hand-keypoints.yaml.
لاستخدام ملف YAML هذا للتدريب، حدده في برنامج التدريب النصي أو أمر CLI كما هو موضح في مثال التدريب أعلاه. لمزيد من التفاصيل، راجع قسم Dataset YAML.