تخطي إلى المحتوى

مجموعة بيانات Roboflow 100

Roboflow 100، برعاية Intel، هو معيار رائد لمجموعة بيانات اكتشاف الكائنات. يتضمن 100 مجموعة بيانات متنوعة تم أخذ عينات منها من أكثر من 90,000 مجموعة بيانات عامة متاحة على Roboflow Universe. تم تصميم هذا المعيار خصيصًا لاختبار قدرة نماذج الرؤية الحاسوبية، مثل نماذج Ultralytics YOLO، على التكيف مع المجالات المختلفة، بما في ذلك الرعاية الصحية والتصوير الجوي وألعاب الفيديو.

تقدم Ultralytics خيارين للترخيص:

تقدم Ultralytics خيارين للترخيص لاستيعاب حالات الاستخدام المختلفة:

  • رخصة AGPL-3.0: هذه الرخصة مفتوحة المصدر المعتمدة من OSI مثالية للطلاب والمتحمسين، وتعزز التعاون المفتوح وتبادل المعرفة. راجع ملف الترخيص (LICENSE) لمزيد من التفاصيل وقم بزيارة صفحة رخصة AGPL-3.0 الخاصة بنا.
  • ترخيص مؤسسي: تم تصميم هذا الترخيص للاستخدام التجاري، ويسمح بالتكامل السلس لبرامج Ultralytics ونماذج الذكاء الاصطناعي في المنتجات والخدمات التجارية. إذا كان السيناريو الخاص بك يتضمن تطبيقات تجارية، فيرجى التواصل عبر ترخيص Ultralytics.

نظرة عامة على Roboflow 100

الميزات الرئيسية

  • نطاقات متنوعة: يتضمن 100 مجموعة بيانات عبر سبعة نطاقات متميزة: جوية، وألعاب الفيديو، ومجهرية، وتحت الماء، ومستندات، وكهرومغناطيسية، والعالم الحقيقي.
  • مقياس: يشتمل المعيار على 224,714 صورة عبر 805 فئة، تمثل أكثر من 11,170 ساعة من جهد تصنيف البيانات.
  • التوحيد القياسي: تتم معالجة جميع الصور وتغيير حجمها إلى 640 × 640 بكسل لتقييم متسق.
  • تقييم نظيف: يركز على إزالة الغموض في الفئات وتصفية الفئات الممثلة تمثيلاً ناقصًا لضمان تقييم نموذج أنظف.
  • التعليقات التوضيحية: تتضمن مربعات محيطة للكائنات، ومناسبة للتدريب وتقييم نماذج الكشف عن الكائنات باستخدام مقاييس مثل mAP.

هيكل مجموعة البيانات

تم تنظيم مجموعة بيانات Roboflow 100 في سبع فئات، تحتوي كل منها على مجموعة فريدة من مجموعات البيانات والصور والفئات:

  • جوي: 7 مجموعات بيانات، 9,683 صورة، 24 فئة.
  • ألعاب الفيديو: 7 مجموعات بيانات، 11,579 صورة، 88 فئة.
  • مجهري: 11 مجموعة بيانات، 13,378 صورة، 28 فئة.
  • تحت الماء: 5 مجموعات بيانات، 18,003 صورة، 39 فئة.
  • المستندات: 8 مجموعات بيانات، 24,813 صورة، 90 فئة.
  • Electromagnetic: 12 مجموعة بيانات، 36,381 صورة، 41 فئة.
  • العالم الحقيقي: 50 مجموعة بيانات، 110,615 صورة، 495 فئة.

يوفر هذا الهيكل أرضية اختبار متنوعة وواسعة لـ نماذج الكشف عن الكائنات، مما يعكس مجموعة واسعة من سيناريوهات التطبيقات الواقعية الموجودة في مختلف حلول Ultralytics.

قياس الأداء

يتضمن قياس أداء مجموعة البيانات تقييم أداء نماذج التعلم الآلي على مجموعات بيانات محددة باستخدام مقاييس موحدة. تتضمن المقاييس الشائعة الدقة، ومتوسط الدقة (mAP)، و F1-score. يمكنك معرفة المزيد حول هذه المقاييس في دليل مقاييس أداء YOLO الخاص بنا.

نتائج القياس

سيتم تخزين نتائج القياس باستخدام البرنامج النصي المتوفر في ultralytics-benchmarks/ في الدليل، تحديدًا في evaluation.txt.

مثال على القياس

يوضح البرنامج النصي التالي كيفية قياس أداء نموذج Ultralytics YOLO (على سبيل المثال، YOLOv11n) برمجيًا على جميع مجموعات البيانات الـ 100 داخل معيار Roboflow 100 باستخدام RF100Benchmark class.

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolo11s.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove the 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

التطبيقات

يعتبر Roboflow 100 لا يقدر بثمن لمختلف التطبيقات المتعلقة بالرؤية الحاسوبية و بالتعلم العميق. يمكن للباحثين والمهندسين الاستفادة من هذا المعيار من أجل:

لمزيد من الأفكار والإلهام حول تطبيقات العالم الحقيقي، استكشف أدلتنا حول المشاريع العملية أو تحقق من Ultralytics HUB للحصول على تدريب نموذجي و نشر مبسط.

الاستخدام

تتوفر مجموعة بيانات Roboflow 100، بما في ذلك البيانات الوصفية وروابط التنزيل، على الموقع الرسمي مستودع Roboflow 100 على GitHubيمكنك الوصول إلى مجموعة البيانات والاستفادة منها مباشرة من هناك لتلبية احتياجات القياس الخاصة بك. إن Ultralytics RF100Benchmark تعمل الأداة المساعدة على تبسيط عملية تنزيل وإعداد مجموعات البيانات هذه لاستخدامها مع نماذج Ultralytics.

نماذج من البيانات والتعليقات التوضيحية

يتكون Roboflow 100 من مجموعات بيانات تحتوي على صور متنوعة تم التقاطها من زوايا ومجالات مختلفة. فيما يلي أمثلة للصور المشروحة المضمنة في معيار RF100، والتي تعرض مجموعة متنوعة من الكائنات والمشاهد. يمكن لتقنيات مثل زيادة البيانات أن تزيد من تعزيز التنوع أثناء التدريب.

نماذج من البيانات والتعليقات التوضيحية

يمثل التنوع الذي يظهر في معيار Roboflow 100 تقدمًا كبيرًا عن المعايير التقليدية، والتي غالبًا ما تركز على تحسين مقياس واحد داخل نطاق محدود. يساعد هذا النهج الشامل في تطوير نماذج رؤية الكمبيوتر أكثر قوة وتنوعًا قادرة على الأداء الجيد عبر مجموعة كبيرة من السيناريوهات المختلفة.

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات Roboflow 100 في عملك البحثي أو التطويري، فيرجى الاستشهاد بالورقة الأصلية:

@misc{rf100benchmark,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Year = {2022},
    Eprint = {arXiv:2211.13523},
    url = {https://arxiv.org/abs/2211.13523}
}

نتقدم بخالص الشكر والتقدير لفريق Roboflow وجميع المساهمين لجهودهم الكبيرة في إنشاء مجموعة بيانات Roboflow 100 والحفاظ عليها كمورد قيم لمجتمع رؤية الحاسوب.

إذا كنت مهتمًا باستكشاف المزيد من مجموعات البيانات لتحسين مشاريع اكتشاف الأهداف والتعلم الآلي الخاصة بك، فلا تتردد في زيارة مجموعة البيانات الشاملة الخاصة بنا، والتي تتضمن مجموعة متنوعة من مجموعات بيانات الاكتشاف الأخرى.

الأسئلة الشائعة

ما هي مجموعة بيانات Roboflow 100، وما أهميتها لاكتشاف الكائنات؟

مجموعة بيانات Roboflow 100 هي معيار لنماذج اكتشاف الكائنات. وهي تتألف من 100 مجموعة بيانات متنوعة مصدرها Roboflow Universe، وتغطي مجالات مثل الرعاية الصحية والتصوير الجوي وألعاب الفيديو. تكمن أهميتها في توفير طريقة موحدة لاختبار قدرة النموذج على التكيف وقوته عبر مجموعة واسعة من سيناريوهات العالم الحقيقي، والانتقال إلى ما وراء المعايير التقليدية التي غالبًا ما تكون محدودة بالمجال.

ما هي المجالات التي تغطيها مجموعة بيانات Roboflow 100؟

تغطي مجموعة بيانات Roboflow 100 سبعة مجالات متنوعة، وتقدم تحديات فريدة لنماذج اكتشاف الكائنات:

  1. جوي: 7 مجموعات بيانات (مثل صور الأقمار الصناعية، وعروض الطائرات بدون طيار).
  2. ألعاب الفيديو: 7 مجموعات بيانات (مثل، كائنات من بيئات ألعاب مختلفة).
  3. مجهري: 11 مجموعة بيانات (مثل الخلايا والجسيمات).
  4. تحت الماء: 5 مجموعات بيانات (مثل الحياة البحرية والأشياء المغمورة).
  5. المستندات: 8 مجموعات بيانات (مثل مناطق النص وعناصر النموذج).
  6. Electromagnetic: 12 مجموعة بيانات (مثل توقيعات الرادار، تصورات البيانات الطيفية).
  7. العالم الحقيقي: 50 مجموعة بيانات (فئة واسعة تشمل الأشياء اليومية والمشاهد والبيع بالتجزئة وما إلى ذلك).

هذا التنوع يجعل RF100 موردًا ممتازًا لتقييم قابلية التعميم لنماذج رؤية الكمبيوتر.

ما الذي يجب أن أدرجه عند الاستشهاد بمجموعة بيانات Roboflow 100 في بحثي؟

عند استخدام مجموعة بيانات Roboflow 100، يرجى الاستشهاد بالورقة الأصلية لمنح الفضل للمبدعين. إليك اقتباس BibTeX الموصى به:

@misc{rf100benchmark,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Year = {2022},
    Eprint = {arXiv:2211.13523},
    url = {https://arxiv.org/abs/2211.13523}
}

لمزيد من الاستكشاف، ضع في اعتبارك زيارة مجموعتنا الشاملة من مجموعات البيانات أو تصفح مجموعات بيانات الكشف الأخرى المتوافقة مع نماذج Ultralytics.



📅 أُنشئ منذ سنة واحدة ✏️ تم التحديث منذ 3 أشهر

تعليقات