Back to Search Start Over

Détection d'anomalies textuelles à base de l'ingénierie d'invite

Authors :
Xu, Yizhou
Gábor, Kata
Khouas, Leila
Segond, Frédérique
Parmentier, Yannick
Estève, Yannick
Jiménez, Tania
Parcollet, Titouan
Zanon Boito, Marcely
CY Cergy-Paris Université, AGORA - INALCO, ERTIM
Institut National des Langues et Civilisations Orientales (Inalco)
ChapsVision
Institut National de Recherche en Informatique et en Automatique (Inria)
Source :
Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale, Traitement Automatique des Langues Naturelles (TALN 2022), Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.42-53
Publication Year :
2022
Publisher :
HAL CCSD, 2022.

Abstract

National audience; La détection d’anomalies textuelles est une tâche importante de la fouille de textes. Plusieurs approches générales, visant l’identification de points de données aberrants, ont été appliqués dans ce domaine. Néanmoins, ces approches exploitent peu les nouvelles avancées du traitement automatique des langues naturelles (TALN). L’avènement des modèles de langage pré-entraînés comme BERT et GPT-2 a donné naissance à un nouveau paradigme de l’apprentissage automatique appelé ingénierie d’invite (prompt engineering) qui a montré de bonnes performances sur plusieurs tâches du TALN. Cet article présente un travail exploratoire visant à examiner la possibilité de détecter des anomalies textuelles à l’aide de l’ingénierie d’invite. Dans nos expérimentations, nous avons examiné la performance de différents modèles d’invite. Les résultats ont montré que l’ingénierie d’invite est une méthode prometteuse pour la détection d’anomalies textuelles.

Details

Language :
French
Database :
OpenAIRE
Journal :
Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale, Traitement Automatique des Langues Naturelles (TALN 2022), Traitement Automatique des Langues Naturelles (TALN 2022), Jun 2022, Avignon, France. pp.42-53
Accession number :
edsair.dedup.wf.001..867c44544fe687357c35372a371d69b9