مجموعة بيانات COCO-Pose Dataset

Q: How is the dataset structured and split for the COCO-Pose dataset?

تنقسم مجموعة بيانات COCO-Pose إلى ثلاث مجموعات فرعية: تساعد هذه المجموعات الفرعية في تنظيم مراحل التدريب والتحقق من الصحة والاختبار بفعالية. للحصول على تفاصيل التكوين، استكشف ملف coco-pose.yaml المتاح على GitHub.

إن مجموعة بيانات COCO-Pose هي نسخة متخصصة من مجموعة بيانات COCO (كائنات مشتركة في السياق)، وهي مصممة لمهام تقدير الوضعية. وهي تستفيد من صور وتسميات COCO Keypoints 2017 لتمكين تدريب نماذج مثل YOLO لمهام تقدير الوضعية.

نموذج صورة الوضعية

نماذج COCO-Pose المدربة مسبقاً

الطراز	الحجم ^(بكسل)	mAPpose^50-95	mAPpose⁵⁰	السرعة ^CPU^{ONNX (مللي ثانية)}	السرعة T4 T4^{TensorRT10 (مللي ثانية)}	بارامز ^(م)	^(ب)
YOLO11n-pose	640	50.0	81.0	52.4 ± 0.5	1.7 ± 0.0	2.9	7.6
YOLO11s-pose	640	58.9	86.3	90.5 ± 0.6	2.6 ± 0.0	9.9	23.2
YOLO11m-pose	640	64.9	89.4	187.3 ± 0.8	4.9 ± 0.1	20.9	71.7
YOLO11l-pose	640	66.1	89.9	247.7 ± 1.1	6.4 ± 0.1	26.2	90.7
YOLO11x-بوز	640	69.5	91.1	488.0 ± 13.9	12.1 ± 0.2	58.8	203.3

الميزات الرئيسية

يعتمد برنامج COCO-Pose على مجموعة بيانات COCO Keypoints 2017 التي تحتوي على 200 ألف صورة موسومة بنقاط أساسية لمهام تقدير الوضعية.
تدعم مجموعة البيانات 17 نقطة رئيسية للأشكال البشرية، مما يسهل تقدير الوضعية التفصيلية.
ومثله مثل COCO، يوفر مقاييس تقييم موحدة، بما في ذلك تشابه نقاط الكائنات الرئيسية (OKS) لمهام تقدير الوضعية، مما يجعله مناسبًا لمقارنة أداء النموذج.

هيكلية مجموعة البيانات

تنقسم مجموعة بيانات COCO-Pose إلى ثلاث مجموعات فرعية:

تدريب 2017: تحتوي هذه المجموعة الفرعية على 56599 صورة من مجموعة بيانات COCO، مشروحة لتدريب نماذج تقدير الوضعية.
Val2017: تحتوي هذه المجموعة الفرعية على 2346 صورة مستخدمة لأغراض التحقق من الصحة أثناء تدريب النموذج.
اختبار2017: تتكون هذه المجموعة الفرعية من الصور المستخدمة لاختبار وقياس النماذج المدربة. لا تتوفر شروح الحقيقة الأساسية لهذه المجموعة الفرعية للجمهور، ويتم إرسال النتائج إلى خادم تقييم COCO لتقييم الأداء.

التطبيقات

تُستخدم مجموعة بيانات COCO-Pose خصيصًا لتدريب وتقييم نماذج التعلّم العميق في مهام اكتشاف النقاط الرئيسية وتقدير الوضعية، مثل OpenPose. إن العدد الكبير من الصور المشروحة في مجموعة البيانات ومقاييس التقييم الموحدة تجعلها موردًا أساسيًا للباحثين والممارسين في مجال الرؤية الحاسوبية الذين يركزون على تقدير الوضعية.

مجموعة البيانات YAML

يُستخدم ملف YAML (لغة ترميز أخرى) لتحديد تكوين مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات وفئاتها والمعلومات الأخرى ذات الصلة. في حالة مجموعة بيانات COCO-Pose، فإن ملف coco-pose.yaml يتم الاحتفاظ بالملف في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco-pose.yaml.

ultralytics/cfg/datasets/coco-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO 2017 Keypoints dataset https://cocodataset.org by Microsoft
# Documentation: https://docs.ultralytics.com/datasets/pose/coco/
# Example usage: yolo train data=coco-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco-pose  ← downloads here (20.1 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco-pose # dataset root dir
train: train2017.txt # train images (relative to 'path') 56599 images
val: val2017.txt # val images (relative to 'path') 2346 images
test: test-dev2017.txt # 20288 of 40670 images, submit to https://codalab.lisn.upsaclay.fr/competitions/7403

# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]

# Classes
names:
  0: person

# Download script/URL (optional)
download: |
  from pathlib import Path

  from ultralytics.utils.downloads import download

  # Download labels
  dir = Path(yaml["path"])  # dataset root dir
  url = "https://github.com/ultralytics/assets/releases/download/v0.0.0/"
  urls = [f"{url}coco2017labels-pose.zip"]
  download(urls, dir=dir.parent)
  # Download data
  urls = [
      "http://images.cocodataset.org/zips/train2017.zip",  # 19G, 118k images
      "http://images.cocodataset.org/zips/val2017.zip",  # 1G, 5k images
      "http://images.cocodataset.org/zips/test2017.zip",  # 7G, 41k images (optional)
  ]
  download(urls, dir=dir / "images", threads=3)

الاستخدام

لتدريب نموذج YOLO11n-pose على مجموعة بيانات COCO-Pose لـ 100 حقبة زمنية بحجم صورة 640، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.

مثال على القطار

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco-pose.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo pose train data=coco-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات COCO-Pose على مجموعة متنوعة من الصور ذات الأشكال البشرية المشروحة بنقاط رئيسية. فيما يلي بعض الأمثلة لصور من مجموعة البيانات، إلى جانب التعليقات التوضيحية المقابلة لها:

صورة عينة مجموعة البيانات

صورة فسيفساء: توضح هذه الصورة دفعة تدريب مكونة من صور مجموعة بيانات موزاييك. الفسيفساء هي تقنية تُستخدم أثناء التدريب تدمج صورًا متعددة في صورة واحدة لزيادة تنوع الأجسام والمشاهد داخل كل دفعة تدريب. يساعد ذلك في تحسين قدرة النموذج على التعميم على أحجام الأجسام المختلفة ونسب أبعادها وسياقاتها.

يعرض هذا المثال تنوع وتعقيد الصور في مجموعة بيانات COCO-Pasas وفوائد استخدام الفسيفساء أثناء عملية التدريب.

الاستشهادات والشكر والتقدير

إذا كنت تستخدم مجموعة بيانات COCO-Passe في عملك البحثي أو التطويري، يُرجى الاستشهاد بالورقة التالية:

BibTeX

@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

نود أن نعرب عن تقديرنا لاتحاد COCO Consortium على إنشاء هذا المورد القيّم لمجتمع الرؤية الحاسوبية والحفاظ عليه. لمزيد من المعلومات حول مجموعة بيانات COCO-Pasaset ومنشئيها، يرجى زيارة الموقع الإلكتروني لمجموعة بيانات COCO.

الأسئلة الشائعة

ما هي مجموعة بيانات COCO-Pose وكيف يتم استخدامها مع Ultralytics YOLO لتقدير الوضعية؟

إن مجموعة بيانات COCO-Pose هي نسخة متخصصة من مجموعة بيانات COCO (كائنات مشتركة في السياق) مصممة لمهام تقدير الوضعية. وهي تعتمد على صور COCO Keypoints 2017 وشروحها، مما يسمح بتدريب نماذج مثل Ultralytics YOLO لتقدير الوضعية التفصيلية. على سبيل المثال، يمكنك استخدام مجموعة بيانات COCO-Pasose لتدريب نموذج YOLO11n-pose من خلال تحميل نموذج مُدرَّب مسبقًا وتدريبه باستخدام تكوين YAML. للاطلاع على أمثلة التدريب، راجع وثائق التدريب.

كيف يمكنني تدريب نموذج YOLO11 على مجموعة بيانات COCO-Pasas؟

يمكن تدريب نموذج YOLO11 على مجموعة بيانات COCO-Passe باستخدام الأمرين Python أو CLI . على سبيل المثال، لتدريب نموذج YOLO11n-pose لـ 100 حقبة زمنية بحجم صورة 640، يمكنك اتباع الخطوات التالية:

مثال على القطار

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco-pose.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo pose train data=coco-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

لمزيد من التفاصيل حول عملية التدريب والحجج المتاحة، راجع صفحة التدريب.

ما هي المقاييس المختلفة التي توفرها مجموعة بيانات COCO-Passe لتقييم أداء النموذج؟

توفر مجموعة بيانات COCO-Pose العديد من مقاييس التقييم الموحدة لمهام تقدير الوضع، على غرار مجموعة بيانات COCO الأصلية. تتضمن المقاييس الرئيسية تشابه النقاط الرئيسية للكائنات (OKS)، والتي تقيّم دقة النقاط الرئيسية المتوقعة مقابل التعليقات التوضيحية للحقيقة الأرضية. تسمح هذه المقاييس بإجراء مقارنات شاملة للأداء بين النماذج المختلفة. على سبيل المثال، نماذج COCO-Pose المدربة مسبقًا مثل YOLO11n-pose و YOLO11s-pose وغيرها لديها مقاييس أداء محددة مدرجة في الوثائق، مثل ^mAPpose50-95و ^mAPpose50.

كيف يتم تنظيم مجموعة البيانات وتقسيمها لمجموعة بيانات COCO-Pose؟

تنقسم مجموعة بيانات COCO-Pose إلى ثلاث مجموعات فرعية:

تدريب 2017: يحتوي على 56599 صورة من صور COCO، مشروحة لتدريب نماذج تقدير الوضعية.
Val2017: 2346 صورة لأغراض التحقق من الصحة أثناء تدريب النموذج.
اختبار2017: الصور المستخدمة لاختبار وقياس النماذج المدربة. شروح الحقيقة الأساسية لهذه المجموعة الفرعية غير متاحة للجمهور؛ يتم إرسال النتائج إلى خادم تقييم COCO لتقييم الأداء.

تساعد هذه المجموعات الفرعية في تنظيم مراحل التدريب والتحقق من الصحة والاختبار بفعالية. للحصول على تفاصيل التكوين، استكشف coco-pose.yaml الملف متاح على جيثب.

ما هي الميزات والتطبيقات الرئيسية لمجموعة بيانات COCO-Passe؟

تعمل مجموعة بيانات COCO-Pose على توسيع نطاق شروح COCO Keypoints 2017 لتشمل 17 نقطة رئيسية للأشكال البشرية، مما يتيح تقدير الوضعية التفصيلية. تسهل مقاييس التقييم الموحدة (على سبيل المثال، OKS) إجراء مقارنات بين النماذج المختلفة. تشمل تطبيقات مجموعة بيانات COCO-Pasose مجالات مختلفة، مثل التحليلات الرياضية والرعاية الصحية والتفاعل بين الإنسان والحاسوب، حيثما يتطلب الأمر تقدير الوضعية التفصيلية للأشكال البشرية. وللاستخدام العملي، يمكن للاستفادة من النماذج المدربة مسبقًا مثل تلك المتوفرة في الوثائق (على سبيل المثال، YOLO11n-pose) أن تبسط العملية بشكل كبير(الميزات الرئيسية).

إذا كنت تستخدم مجموعة بيانات COCO-Passe في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية مع إدخال BibTeX التالي.

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 5 أشهر