PAQA: Vers des systèmes ProActifs face aux Questions Ambiguës

Pierre Erbacher
Jian-Yun Nie
Philippe Preux
Laure Soulier
DOI
10.24348/coria.2024.court_22
Résumé

Les systèmes conversationnels ont fait des progrès significatifs dans la génération de réponses en langage naturel. Cependant, leur potentiel en tant que systèmes de recherche conversationnelle est actuellement limité en raison de leur rôle passif dans le processus de recherche d’information. Une limitation majeure est la rareté des ensembles de données fournissant des questions ambiguës étiquetées ainsi qu’un corpus de documents à l’appui aligné avec des questions de clarification pertinentes. Ce travail vise à générer des questions de clarification pertinentes en prenant en compte les ambiguïtés inhérentes présentes à la fois dans les requêtes des utilisateurs et dans les documents. Pour y parvenir, nous proposons PAQA, une extension de l’ensemble de données AmbiNQ existant, intégrant des questions de clarification. Les questions de clarifications sont évaluées par des humains et nous évaluons l’exploitation du jeu de donnée proposé à ’travers divers scenario. En comblant cette lacune dans les systèmes de recherche conversationnelle, nous visons à fournir une supervision supplémentaire pour améliorer leur participation active au processus de recherche d’informations et fournir aux utilisateurs des résultats plus précis.