Ir para o conteúdo

Dataset de Detecção de Assinaturas

Este dataset se concentra na detecção de assinaturas manuscritas em documentos. Inclui uma variedade de tipos de documentos com assinaturas anotadas, fornecendo insights valiosos para aplicações em verificação de documentos e detecção de fraudes. Essencial para treinar algoritmos de visão computacional, este dataset auxilia na identificação de assinaturas em vários formatos de documentos, apoiando a pesquisa e aplicações práticas na análise de documentos.

Estrutura do Conjunto de Dados

O dataset de detecção de assinaturas é dividido em dois subconjuntos:

  • Conjunto de treinamento: Contém 143 imagens, cada uma com anotações correspondentes.
  • Conjunto de validação: Inclui 35 imagens, cada uma com anotações emparelhadas.

Aplicações

Este conjunto de dados pode ser aplicado em várias tarefas de visão computacional, como detecção de objetos, rastreamento de objetos e análise de documentos. Especificamente, ele pode ser usado para treinar e avaliar modelos para identificar assinaturas em documentos, o que tem aplicações significativas em:

  • Verificação de Documentos: Automatização do processo de verificação de documentos legais e financeiros
  • Detecção de Fraude: Identificação de assinaturas potencialmente falsificadas ou não autorizadas
  • Processamento Digital de Documentos: Agilização de fluxos de trabalho nos setores administrativo e jurídico
  • Bancos e Finanças: Melhorar a segurança no processamento de cheques e na verificação de documentos de empréstimo
  • Pesquisa Arquivística: Apoio à análise e catalogação de documentos históricos

Além disso, serve como um recurso valioso para fins educacionais, permitindo que estudantes e pesquisadores estudem características de assinatura em diferentes tipos de documentos.

YAML do Conjunto de Dados

Um arquivo YAML (Yet Another Markup Language) define a configuração do conjunto de dados, incluindo caminhos e informações de classes. Para o conjunto de dados de detecção de assinatura, o signature.yaml arquivo está localizado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/signature.yaml.

ultralytics/cfg/datasets/signature.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Signature dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/signature/
# Example usage: yolo train data=signature.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── signature ← downloads here (11.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: signature # dataset root dir
train: images/train # train images (relative to 'path') 143 images
val: images/val # val images (relative to 'path') 35 images

# Classes
names:
  0: signature

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/signature.zip

Utilização

Para treinar um modelo YOLO11n no conjunto de dados de detecção de assinatura por 100 épocas com um tamanho de imagem de 640, use os exemplos de código fornecidos. Para uma lista abrangente de parâmetros disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Exemplo de Inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a signature-detection fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
# Start prediction with a finetuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Amostras de Imagens e Anotações

O conjunto de dados de detecção de assinatura compreende uma ampla variedade de imagens que mostram diferentes tipos de documentos e assinaturas anotadas. Abaixo estão exemplos de imagens do conjunto de dados, cada uma acompanhada por suas anotações correspondentes.

Imagem de amostra do dataset de detecção de assinaturas

  • Imagem em Mosaico: Aqui, apresentamos um lote de treinamento consistindo em imagens de conjunto de dados em mosaico. O mosaico, uma técnica de treinamento, combina várias imagens em uma, enriquecendo a diversidade do lote. Este método ajuda a melhorar a capacidade do modelo de generalizar em diferentes tamanhos de assinatura, proporções e contextos.

Este exemplo ilustra a variedade e complexidade das imagens no Conjunto de Dados de Detecção de Assinatura, enfatizando os benefícios de incluir o mosaico durante o processo de treinamento.

Citações e Agradecimentos

O conjunto de dados foi lançado e está disponível sob a Licença AGPL-3.0.

FAQ

O que é o Dataset de Detecção de Assinaturas e como ele pode ser usado?

O Dataset de Detecção de Assinaturas é uma coleção de imagens anotadas com o objetivo de detectar assinaturas humanas em vários tipos de documentos. Pode ser aplicado em tarefas de visão computacional, como detecção de objetos e rastreamento, principalmente para verificação de documentos, detecção de fraudes e pesquisa de arquivo. Este dataset ajuda a treinar modelos para reconhecer assinaturas em diferentes contextos, tornando-o valioso tanto para pesquisa quanto para aplicações práticas em análise inteligente de documentos.

Como faço para treinar um modelo YOLO11n no Dataset de Detecção de Assinaturas?

Para treinar um modelo YOLO11n no Conjunto de Dados de Detecção de Assinaturas, siga estes passos:

  1. Baixe o signature.yaml arquivo de configuração do conjunto de dados de signature.yaml.
  2. Use o seguinte script Python ou comando CLI para iniciar o treinamento:

Exemplo de Treinamento

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="signature.yaml", epochs=100, imgsz=640)
yolo detect train data=signature.yaml model=yolo11n.pt epochs=100 imgsz=640

Para mais detalhes, consulte a página de Treinamento.

Quais são as principais aplicações do Dataset de Detecção de Assinaturas?

O Dataset de Detecção de Assinaturas pode ser usado para:

  1. Verificação de Documentos: Verificação automática da presença e autenticidade de assinaturas humanas em documentos.
  2. Detecção de Fraudes: Identificação de assinaturas falsificadas ou fraudulentas em documentos legais e financeiros.
  3. Pesquisa Arquivística: Auxílio a historiadores e arquivistas na análise digital e catalogação de documentos históricos.
  4. Educação: Apoio à pesquisa acadêmica e ao ensino nas áreas de visão computacional e aprendizado de máquina.
  5. Serviços Financeiros: Aprimorando a segurança em transações bancárias e processamento de empréstimos, verificando a autenticidade da assinatura.

Como posso realizar a inferência usando um modelo treinado no Dataset de Detecção de Assinaturas?

Para realizar a inferência usando um modelo treinado no Dataset de Detecção de Assinaturas, siga estes passos:

  1. Carregue seu modelo ajustado.
  2. Use o script Python ou o comando CLI abaixo para realizar a inferência:

Exemplo de Inferência

from ultralytics import YOLO

# Load the fine-tuned model
model = YOLO("path/to/best.pt")

# Perform inference
results = model.predict("https://ultralytics.com/assets/signature-s.mp4", conf=0.75)
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/signature-s.mp4" conf=0.75

Qual é a estrutura do Dataset de Detecção de Assinaturas e onde posso encontrar mais informações?

O Conjunto de Dados de Detecção de Assinaturas é dividido em dois subconjuntos:

  • Conjunto de Treinamento: Contém 143 imagens com anotações.
  • Conjunto de Validação: Inclui 35 imagens com anotações.

Para informações detalhadas, você pode consultar a Estrutura do Conjunto de Dados seção. Além disso, veja a configuração completa do conjunto de dados no signature.yaml arquivo localizado em signature.yaml.



📅 Criado há 1 ano ✏️ Atualizado há 4 meses

Comentários