تخطي إلى المحتوى

Ultralytics YOLO11

نظرة عامة

YOLO11 هو أحدث إصدار في سلسلة Ultralytics YOLO لكاشفات الأجسام في الوقت الفعلي، حيث يعيد تعريف الممكن باستخدام الدقة والسرعة والكفاءة المتطورة. بناءً على التطورات الرائعة لإصدارات YOLO السابقة، يقدم YOLO11 تحسينات كبيرة في الهندسة المعمارية وطرق التدريب، مما يجعله خيارًا متعدد الاستخدامات لمجموعة واسعة من مهام رؤية الكمبيوتر.

مخططات مقارنة Ultralytics YOLO11

Ultralytics YOLO11 🚀 تم إنشاء البودكاست بواسطة NotebookLM



شاهد: كيفية استخدام Ultralytics YOLO11 للكشف عن الأجسام وتتبعها | كيفية القياس | تم إصدار YOLO11 🚀

الميزات الرئيسية

  • استخلاص ميزات محسّن: يستخدم YOLO11 هيكلًا أساسيًا وهندسة عنق محسّنة، مما يعزز قدرات استخلاص الميزات لتحسين دقة الكشف عن الكائنات وأداء المهام المعقدة.
  • محسّن لتحقيق الكفاءة والسرعة: يقدم YOLO11 تصميمات معمارية محسّنة ومسارات تدريب مُحسَّنة، مما يوفر سرعات معالجة أسرع ويحافظ على توازن مثالي بين الدقة والأداء.
  • دقة أكبر مع عدد أقل من المعلمات: مع التطورات في تصميم النموذج، يحقق YOLO11m متوسط دقة متوسطة (mAP) أعلى على مجموعة بيانات COCO مع استخدام عدد أقل من المعلمات بنسبة 22٪ مقارنةً بـ YOLOv8m، مما يجعله فعالًا من الناحية الحسابية دون المساس بالدقة.
  • القدرة على التكيف عبر البيئات: يمكن نشر YOLO11 بسلاسة عبر بيئات مختلفة، بما في ذلك الأجهزة الطرفية والمنصات السحابية والأنظمة التي تدعم وحدات معالجة الرسوميات NVIDIA GPUs، مما يضمن أقصى قدر من المرونة.
  • نطاق واسع من المهام المدعومة: سواء كان الأمر يتعلق بالكشف عن الأجسام، أو تقسيم المثيلات، أو تصنيف الصور، أو تقدير الوضعية، أو الكشف عن الأجسام الموجهة (OBB)، فقد تم تصميم YOLO11 لتلبية مجموعة متنوعة من تحديات رؤية الكمبيوتر.

المهام والأوضاع المدعومة

يعتمد YOLO11 على مجموعة النماذج متعددة الاستخدامات التي تم تقديمها في YOLOv8، مما يوفر دعمًا محسنًا عبر مهام رؤية الكمبيوتر المختلفة:

النموذج أسماء الملفات المهمة الاستدلال التحقق التدريب تصدير
YOLO11 yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.pt اكتشاف
YOLO11-seg yolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.pt تجزئة المثيل
YOLO11-pose yolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.pt الوضع/النقاط الرئيسية
YOLO11-obb yolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.pt الكشف الموجه
YOLO11-cls yolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.pt التصنيف

يقدم هذا الجدول نظرة عامة على متغيرات نموذج YOLO11، ويعرض قابليتها للتطبيق في مهام محددة وتوافقها مع أوضاع التشغيل مثل الاستدلال والتحقق والتدريب والتصدير. هذه المرونة تجعل YOLO11 مناسبًا لمجموعة واسعة من التطبيقات في رؤية الكمبيوتر، من الكشف في الوقت الفعلي إلى مهام التقسيم المعقدة.

مقاييس الأداء

الأداء

راجع وثائق الكشف للحصول على أمثلة حول كيفية استخدام هذه النماذج المدربة على COCO، والتي تتضمن 80 فئة مُدرَّبة مسبقًا.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 ± 0.8 1.5 ± 0.0 2.6 6.5
YOLO11s 640 47.0 90.0 ± 1.2 2.5 ± 0.0 9.4 21.5
YOLO11m 640 51.5 183.2 ± 2.0 4.7 ± 0.1 20.1 68.0
YOLO11l 640 53.4 238.6 ± 1.4 6.2 ± 0.1 25.3 86.9
YOLO11x 640 54.7 462.8 ± 6.7 11.3 ± 0.2 56.9 194.9

راجع وثائق التقسيم للحصول على أمثلة حول كيفية استخدام هذه النماذج المدربة على COCO، والتي تتضمن 80 فئة مُدرَّبة مسبقًا.

النموذج الحجم
(بالبكسل)
mAPمربع
50-95
mAPقناع
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n-seg 640 38.9 32.0 65.9 ± 1.1 1.8 ± 0.0 2.9 10.4
YOLO11s-seg 640 46.6 37.8 117.6 ± 4.9 2.9 ± 0.0 10.1 35.5
YOLO11m-seg 640 51.5 41.5 281.6 ± 1.2 6.3 ± 0.1 22.4 123.3
YOLO11l-seg 640 53.4 42.9 344.2 ± 3.2 7.8 ± 0.2 27.6 142.2
YOLO11x-seg 640 54.7 43.8 664.5 ± 3.2 15.8 ± 0.7 62.1 319.0

راجع وثائق التصنيف للحصول على أمثلة حول كيفية استخدام هذه النماذج المدربة على ImageNet، والتي تتضمن 1000 فئة مُدرَّبة مسبقًا.

النموذج الحجم
(بالبكسل)
acc
top1
acc
top5
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B) عند 224
YOLO11n-cls 224 70.0 89.4 5.0 ± 0.3 1.1 ± 0.0 1.6 0.5
YOLO11s-cls 224 75.4 92.7 7.9 ± 0.2 1.3 ± 0.0 5.5 1.6
YOLO11m-cls 224 77.3 93.9 17.2 ± 0.4 2.0 ± 0.0 10.4 5.0
YOLO11l-cls 224 78.3 94.3 23.2 ± 0.3 2.8 ± 0.0 12.9 6.2
YOLO11x-cls 224 79.5 94.9 41.4 ± 0.9 3.8 ± 0.0 28.4 13.7

راجع وثائق تقدير الوضعية للحصول على أمثلة حول كيفية استخدام هذه النماذج المدربة على COCO، والتي تتضمن فئة واحدة مُدرَّبة مسبقًا، 'شخص'.

النموذج الحجم
(بالبكسل)
mAPpose
50-95
mAPpose
50
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n-pose 640 50.0 81.0 52.4 ± 0.5 1.7 ± 0.0 2.9 7.6
YOLO11s-pose 640 58.9 86.3 90.5 ± 0.6 2.6 ± 0.0 9.9 23.2
YOLO11m-pose 640 64.9 89.4 187.3 ± 0.8 4.9 ± 0.1 20.9 71.7
YOLO11l-pose 640 66.1 89.9 247.7 ± 1.1 6.4 ± 0.1 26.2 90.7
YOLO11x-pose 640 69.5 91.1 488.0 ± 13.9 12.1 ± 0.2 58.8 203.3

راجع مستندات الكشف الموجه للحصول على أمثلة حول كيفية استخدام هذه النماذج المدربة على DOTAv1، والتي تتضمن 15 فئة مدربة مسبقًا.

النموذج الحجم
(بالبكسل)
mAPtest
50
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n-obb 1024 78.4 117.6 ± 0.8 4.4 ± 0.0 2.7 17.2
YOLO11s-obb 1024 79.5 219.4 ± 4.0 5.1 ± 0.0 9.7 57.5
YOLO11m-obb 1024 80.9 562.8 ± 2.9 10.1 ± 0.4 20.9 183.5
YOLO11l-obb 1024 81.0 712.5 ± 5.0 13.5 ± 0.6 26.2 232.0
YOLO11x-obb 1024 81.3 1408.6 ± 7.7 28.6 ± 1.0 58.8 520.2

أمثلة الاستخدام

يوفر هذا القسم أمثلة بسيطة لتدريب واستدلال YOLO11. للحصول على وثائق كاملة حول هذه الأوضاع وغيرها، راجع صفحات وثائق التوقع و التدريب و التقييم و التصدير.

لاحظ أن المثال أدناه خاص بنماذج YOLO11 للكشف عن الأجسام. للحصول على مهام إضافية مدعومة، راجع وثائق التقسيم و التصنيف و OBB و الوضعية.

مثال

PyTorch مدربة مسبقًا *.pt بالإضافة إلى نماذج التهيئة *.yaml يمكن تمرير الملفات إلى YOLO() class لإنشاء مثيل نموذج في Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

تتوفر أوامر CLI لتشغيل النماذج مباشرة:

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained YOLO11n model and run inference on the 'bus.jpg' image
yolo predict model=yolo11n.pt source=path/to/bus.jpg

الاقتباسات والشكر والتقدير

منشور Ultralytics YOLO11

لم تنشر Ultralytics ورقة بحثية رسمية لـ YOLO11 نظرًا للطبيعة سريعة التطور للنماذج. نحن نركز على تطوير التكنولوجيا وتسهيل استخدامها، بدلاً من إنتاج وثائق ثابتة. للحصول على أحدث المعلومات حول بنية YOLO وميزاته واستخدامه، يرجى الرجوع إلى مستودع GitHub الخاص بنا و الوثائق.

إذا كنت تستخدم YOLO11 أو أي برنامج آخر من هذا المستودع في عملك، فيرجى الاستشهاد به باستخدام التنسيق التالي:

@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

يرجى ملاحظة أن رقم DOI معلق وسيتم إضافته إلى الاقتباس بمجرد توفره. يتم توفير نماذج YOLO11 بموجب تراخيص AGPL-3.0 و Enterprise.

الأسئلة الشائعة

ما هي التحسينات الرئيسية في Ultralytics YOLO11 مقارنة بالإصدارات السابقة؟

يقدم Ultralytics YOLO11 العديد من التطورات الهامة مقارنة بالإصدارات السابقة. تشمل التحسينات الرئيسية ما يلي:

  • تحسين استخلاص الميزات: تستخدم YOLO11 بنية خلفية وعنق محسّنة، مما يعزز قدرات استخلاص الميزات للحصول على دقة أعلى في الكشف عن الأجسام.
  • كفاءة وسرعة محسّنة: توفر التصميمات المعمارية المحسّنة وخطوط التدريب المُحسَّنة سرعات معالجة أسرع مع الحفاظ على التوازن بين الدقة والأداء.
  • دقة أكبر مع عدد أقل من المعلمات: تحقق YOLO11m متوسط دقة Precision أعلى (mAP) على مجموعة بيانات COCO مع عدد معلمات أقل بنسبة 22٪ من YOLOv8m، مما يجعلها فعالة من حيث الحوسبة دون المساومة على الدقة.
  • القدرة على التكيف عبر البيئات: يمكن نشر YOLO11 عبر بيئات مختلفة، بما في ذلك الأجهزة الطرفية والمنصات السحابية والأنظمة التي تدعم وحدات معالجة الرسوميات NVIDIA GPUs.
  • نطاق واسع من المهام المدعومة: تدعم YOLO11 مهام رؤية الكمبيوتر المتنوعة مثل الكشف عن الأجسام، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضعية، والكشف عن الأجسام الموجهة (OBB).

كيف يمكنني تدريب نموذج YOLO11 للكشف عن الأجسام؟

يمكن تدريب نموذج YOLO11 للكشف عن الأجسام باستخدام أوامر Python أو CLI. فيما يلي أمثلة للطريقتين:

مثال

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

للحصول على تعليمات أكثر تفصيلاً، راجع وثائق التدريب.

ما هي المهام التي يمكن أن تؤديها نماذج YOLO11؟

تتميز نماذج YOLO11 بأنها متعددة الاستخدامات وتدعم مجموعة واسعة من مهام رؤية الكمبيوتر، بما في ذلك:

  • الكشف عن الأجسام: تحديد وتحديد مواقع الأجسام داخل الصورة.
  • تجزئة المثيلات: الكشف عن الأجسام وتحديد حدودها.
  • تصنيف الصور: تصنيف الصور إلى فئات محددة مسبقًا.
  • تقدير الوضعية: الكشف عن النقاط الرئيسية في أجسام الإنسان وتتبعها.
  • الكشف عن الأجسام الموجهة (OBB): الكشف عن الأجسام مع تدوير للحصول على دقة أعلى.

لمزيد من المعلومات حول كل مهمة، راجع وثائق الكشف، وتجزئة المثيلات، والتصنيف، وتقدير الوضعية، والكشف الموجه.

كيف تحقق YOLO11 دقة أكبر مع عدد أقل من المعلمات؟

يحقق YOLO11 دقة أكبر مع عدد أقل من المعلمات من خلال التطورات في تصميم النموذج وتقنيات التحسين. تسمح البنية المحسنة باستخراج الميزات ومعالجتها بكفاءة، مما يؤدي إلى متوسط دقة متوسطة أعلى (mAP) على مجموعات البيانات مثل COCO مع استخدام معلمات أقل بنسبة 22٪ من YOLOv8m. وهذا يجعل YOLO11 فعالاً من الناحية الحسابية دون المساس بالدقة، مما يجعله مناسبًا للنشر على الأجهزة ذات الموارد المحدودة.

هل يمكن نشر YOLO11 على الأجهزة الطرفية؟

نعم، تم تصميم YOLO11 للتكيف عبر بيئات مختلفة، بما في ذلك الأجهزة الطرفية. إن بنيتها المحسّنة وقدرات المعالجة الفعالة تجعلها مناسبة للنشر على الأجهزة الطرفية والمنصات السحابية والأنظمة التي تدعم وحدات معالجة الرسوميات NVIDIA GPUs. تضمن هذه المرونة إمكانية استخدام YOLO11 في تطبيقات متنوعة، بدءًا من الكشف في الوقت الفعلي على الأجهزة المحمولة وحتى مهام التجزئة المعقدة في البيئات السحابية. لمزيد من التفاصيل حول خيارات النشر، راجع وثائق التصدير.



📅 تم إنشاؤه منذ 9 أشهر ✏️ تم التحديث منذ 3 أيام

تعليقات