مجموعة بيانات الكشف عن التوقيع
تركز مجموعة البيانات هذه على اكتشاف التوقيعات المكتوبة بخط اليد داخل المستندات. وهي تتضمن مجموعة متنوعة من أنواع المستندات مع توقيعات مشروحة، مما يوفر رؤى قيمة لتطبيقات التحقق من المستندات والكشف عن الاحتيال. تعتبر هذه المجموعة ضرورية لتدريب خوارزميات الرؤية الحاسوبية، وتساعد في تحديد التوقيعات بتنسيقات المستندات المختلفة، ودعم البحث والتطبيقات العملية في تحليل المستندات.
هيكل مجموعة البيانات
تنقسم مجموعة بيانات الكشف عن التوقيع إلى مجموعتين فرعيتين:
- مجموعة التدريب: تحتوي على 143 صورة، لكل منها تعليقات توضيحية مقابلة.
- مجموعة التحقق: تتضمن 35 صورة، لكل منها تعليقات توضيحية مزدوجة.
التطبيقات
يمكن تطبيق مجموعة البيانات هذه في مهام رؤية الكمبيوتر المختلفة مثل اكتشاف الكائنات و تتبع الكائنات وتحليل المستندات. على وجه التحديد، يمكن استخدامه لتدريب وتقييم النماذج لتحديد التوقيعات في المستندات، والتي لها تطبيقات مهمة في:
- التحقق من المستندات: أتمتة عملية التحقق للمستندات القانونية والمالية
- اكتشاف الاحتيال: تحديد التوقيعات المزورة أو غير المصرح بها المحتملة
- معالجة المستندات الرقمية: تبسيط سير العمل في القطاعات الإدارية والقانونية
- الخدمات المصرفية والمالية: تعزيز الأمن في معالجة الشيكات والتحقق من مستندات القروض
- البحث الأرشيفي: دعم تحليل الوثائق التاريخية وفهرستها
بالإضافة إلى ذلك، فهو بمثابة مورد قيم للأغراض التعليمية، وتمكين الطلاب والباحثين من دراسة الخصائص المميزة عبر أنواع المستندات المختلفة.
ملف YAML لمجموعة البيانات
يحدد ملف YAML (Yet Another Markup Language) تكوين مجموعة البيانات، بما في ذلك مسارات ومعلومات الفئات. بالنسبة لمجموعة بيانات الكشف عن التوقيع، signature.yaml
يقع الملف في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.
ultralytics/cfg/datasets/signature.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
# └── signature ← downloads here (11.3 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images
# Classes
names:
0: signature
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip
الاستخدام
لتدريب نموذج YOLO11n على مجموعة بيانات الكشف عن التوقيع لمدة 100 حقبة بحجم صورة 640، استخدم نماذج التعليمات البرمجية المتوفرة. للحصول على قائمة شاملة بالمعلمات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.
مثال على التدريب
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640
مثال على الاستدلال
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a signature-detection fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75
عينات من الصور والشروحات التوضيحية
تشتمل مجموعة بيانات الكشف عن التوقيع على مجموعة واسعة من الصور التي تعرض أنواعًا مختلفة من المستندات والتوقيعات المشروحة. فيما يلي أمثلة لصور من مجموعة البيانات، مصحوبة بكل الشروحات المقابلة لها.
- صورة الفسيفساء: هنا، نقدم دفعة تدريبية تتكون من صور مجموعة البيانات المجمعة. الفسيفساء، وهي تقنية تدريب، تجمع بين صور متعددة في صورة واحدة، مما يثري تنوع الدُفعة. تساعد هذه الطريقة على تحسين قدرة النموذج على التعميم عبر أحجام التوقيعات ونسب العرض إلى الارتفاع والسياقات المختلفة.
يوضح هذا المثال تنوع وتعقيد الصور في مجموعة بيانات الكشف عن التوقيع، مع التأكيد على فوائد تضمين الفسيفساء أثناء عملية التدريب.
الاقتباسات والإقرارات
تم إصدار مجموعة البيانات بموجب ترخيص AGPL-3.0.
الأسئلة الشائعة
ما هي مجموعة بيانات Signature Detection، وكيف يمكن استخدامها؟
مجموعة بيانات الكشف عن التوقيع هي عبارة عن مجموعة من الصور المشروحة التي تهدف إلى الكشف عن التوقيعات البشرية داخل أنواع مختلفة من المستندات. يمكن تطبيقه في مهام رؤية الكمبيوتر مثل الكشف عن الكائنات وتتبعها، وذلك بشكل أساسي للتحقق من المستندات والكشف عن الاحتيال والبحث الأرشيفي. تساعد هذه المجموعة من البيانات في تدريب النماذج على التعرف على التوقيعات في سياقات مختلفة، مما يجعلها ذات قيمة لكل من البحث والتطبيقات العملية في تحليل المستندات الذكي.
كيف يمكنني تدريب نموذج YOLO11n على مجموعة بيانات Signature Detection؟
لتدريب نموذج YOLO11n على مجموعة بيانات الكشف عن التوقيع، اتبع الخطوات التالية:
- تنزيل
signature.yaml
ملف تكوين مجموعة البيانات من signature.yaml. - استخدم سكريبت python التالي أو أمر CLI لبدء التدريب:
مثال على التدريب
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo11n.pt")
# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640
لمزيد من التفاصيل، راجع صفحة التدريب.
ما هي التطبيقات الرئيسية لمجموعة بيانات الكشف عن التوقيع؟
يمكن استخدام مجموعة بيانات اكتشاف التوقيع من أجل:
- التحقق من المستندات: التحقق تلقائيًا من وجود وتوثيق التوقيعات البشرية في المستندات.
- الكشف عن الاحتيال: تحديد التوقيعات المزورة أو الاحتيالية في المستندات القانونية والمالية.
- البحث الأرشيفي: مساعدة المؤرخين وأمناء المحفوظات في التحليل الرقمي وفهرسة الوثائق التاريخية.
- التعليم: دعم البحث الأكاديمي والتدريس في مجالات رؤية الحاسوب و التعلم الآلي.
- الخدمات المالية: تعزيز الأمن في المعاملات المصرفية ومعالجة القروض عن طريق التحقق من صحة التوقيع.
كيف يمكنني إجراء الاستدلال باستخدام نموذج تم تدريبه على مجموعة بيانات الكشف عن التوقيع؟
لتنفيذ الاستدلال باستخدام نموذج تم تدريبه على مجموعة بيانات اكتشاف التوقيع، اتبع الخطوات التالية:
- قم بتحميل النموذج المضبوط بدقة.
- استخدم سكريبت python أدناه أو أمر CLI لتنفيذ الاستدلال:
مثال على الاستدلال
from ultralytics import YOLO
# Load the fine-tuned model
model = YOLO("path/to/best.pt")
# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75
ما هو هيكل مجموعة بيانات الكشف عن التوقيع، وأين يمكنني العثور على مزيد من المعلومات؟
تنقسم مجموعة بيانات الكشف عن التوقيع إلى مجموعتين فرعيتين:
- مجموعة التدريب: تحتوي على 143 صورة مع شروحات.
- مجموعة التحقق: تتضمن 35 صورة مع شروحات.
للحصول على معلومات مفصلة، يمكنك الرجوع إلى هيكل مجموعة البيانات القسم. بالإضافة إلى ذلك، اعرض تكوين مجموعة البيانات الكامل في signature.yaml
الملف موجود في signature.yaml.