Détection des Erreurs d’OCR sur base de Confiance
- DOI
- 10.24348/coria.2024.abstract_28
Résumé
Malgré les avancées en Reconnaissance Optique de Caractères (OCR), des erreurs affectent les processus en aval. Nous explorons leur utilisation pour améliorer la détection d’erreurs via une méthode intégrant ces scores dans un modèle basé sur BERT, nommé ConfBERT. Nos expériences révèlent que les scores de confiance améliorent la détection d’erreurs, variant selon l’étalonnage du système d’OCR.