Extraction d’information induite par sous-graphes (SETI) appliquée aux documents administratifs

Dipendra Sharma Kafle
Eliott Thomas
Mickael Coustaty
Aurélie Joseph
Antoine Doucet
Vincent Poulain D'Andecy
DOI
10.24348/coria.2024.abstract_6
Résumé

L’extraction d’informations joue un rôle clé dans l’automatisation des processus d’audit des documents administratifs. Cependant, la variété dans la mise en page et le langage constitue toujours une tâche difficile. D’autre part, il est rare de trouver d’importants ensembles de données d’entraînement publics liés aux documents administratifs tels que les factures. Dans ce travail, nous utilisons le modèle Graph Attention Network pour l’extraction d’informations. Ce type de modèle facilite la compréhension du mécanisme par rapport aux réseaux neuronaux classiques en raison de la visualisation du lien entre les entités dans le graphe. De plus, il maximise la récupération de la mise en page et de la structure, ce qui constitue un avantage crucial dans les documents administratifs. À partir du même graphe, notre modèle apprend à différents niveaux du graphe pour encapsuler des connaissances dynamiques et plus riches dans chaque lot, maximisant ainsi la généralisation sur des ensembles de données plus petits. Nous présentons comment le modèle apprend à chaque niveau du graphe et comparons les résultats avec des bases sur des ensembles de données privés ainsi que publics. Notre modèle réussit à améliorer les scores de rappel et de précision pour certaines classes dans notre ensemble de données privé et produit des résultats comparables pour les ensembles de données publics destinés à la compréhension des formulaires et à l’extraction d’informations. Cette soumission est le résumé traduit d’un article publié à la conférence ICDAR 2023.