Extracting Key-Value Pairs in Business Documents

Eliott Thomas
Dipendra Sharma Kafle
Ibrahim Souleiman Mahamoud
Aurélie Joseph
Mickaël Coustaty
Vincent Poulain D'Andecy
DOI
10.24348/coria.2024.abstract_7
Résumé

L’extraction de clé-valeur représente un défi majeur dans le domaine de l’IA appliquée aux documents administratifs telles que les factures. Cette tâche vise à extraire des éléments comme par exemple les numéros de documents ou les montants financiers. L’exactitude de cette extraction est cruciale pour des activités ultérieures telles que la comptabilité, l’analyse et la prise de décision. Il est important de faire du multimodal (texte, image, …) et du multilingue en raison de l’immense variété de documents concernés. Ce papier présente une méthode novatrice combinant des règles métiers et un modèle transformers pré-entraîné. Ceci pour regrouper, classifier et lier ces clés-valeurs de manière précise et robuste. Le contexte de ce travail découle d’une collaboration entre le laboratoire L3i et l’entreprise Yooz. Cette soumission est le résumé traduit d’un article publié à la conférence ICDAR 2023 [1].