Détection des Erreurs d’OCR sur base de Confiance

Arthur Hemmer
Mickaël Coustaty
Nicola Bartolo
Jean-Marc Ogier
DOI
10.24348/coria.2024.abstract_28
Résumé

Malgré les avancées en Reconnaissance Optique de Caractères (OCR), des erreurs affectent les processus en aval. Nous explorons leur utilisation pour améliorer la détection d’erreurs via une méthode intégrant ces scores dans un modèle basé sur BERT, nommé ConfBERT. Nos expériences révèlent que les scores de confiance améliorent la détection d’erreurs, variant selon l’étalonnage du système d’OCR.