Intégration de Vocabulaire Spécifique au Domaine dans une Méthode d’Ordonnancement de Documents Biomédicaux Basée sur BERT.
- DOI
- 10.24348/coria.2024.abstract_23
Résumé
Ce résumé présente un aperçu de la méthode utilisée lors de la campagne d’évaluation BioASQ 11B sur l’ordonnancement de documents et détaillée dans les « working notes » de la campagne. Nous avons proposé une méthode en 2 phases : la première basée sur les sacs de mots et BM25, développée avec Pyserini, et la seconde basée sur une implémentation de CEDR, un modèle basé sur BERT. Nous présentons une stratégie pour incorporer des connaissances biomédicales dans de tels modèles afin d’améliorer leur compréhension du contexte, l’idée étant qu’un terme du domaine est porteur d’une information spécifique.