Ingénierie d'Invite pour la Traduction Automatique de Langues Vraiment peu Dotées - Etude Préliminaire du Cas de l'Occitan
- DOI
- 10.24348/coria.2024.long_25
Il y a plus de 7,100 langues vivantes dans le monde mais plus de 40% sont en danger; cela est le cas de l’occitan, langue du sud de la France et de parties de l’Espagne et d’Italie. Il existe peu de traducteurs automatiques pour l’occitan. Dans cet article, nous nous intéressons aux grands modèles de langue pour la traduction automatique en gascon, une variante de l’occitan. Cette méthode consiste à concevoir et à affiner des invites textuelles spécifiques pour guider les grands modèles de langage, afin de générer les sorties souhaitées. Nous nous sommes concentrés sur le modèle de langue pré-entrainé GPT-4 au travers de Chat-GPT. Nous avons testé différentes façons de rédiger des prompts et d’amener de la connaissance externe pour améliorer les traductions. Ici, nous discutons les différents résultats obtenus et présentons des pistes de réflexion relatives aux questions de recherche qui sont soulevées par ces résultats.