Back to Search Start Over

Conception d'un outil de visualisation et d'exploration de chaînes de coréférences

Authors :
Landragin, Frédéric
Université Paris sciences et lettres (PSL)
Université Sorbonne Paris Cité (USPC)
Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice)
Département Littératures et langage - ENS Paris (LILA)
École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Sorbonne Paris Cité (USPC)-Université Sorbonne Nouvelle - Paris 3
Damon Mayaffre
Céline Poudat
Laurent Vanni
Véronique Magri
Peter Follette
ANR-15-CE38-0008,DEMOCRAT,DEscription et MOdélisation des Chaînes de Référence : outils pour l'Annotation de corpus (en diachronie et en langues comparées) et le Traitement automatique(2015)
Université Sorbonne Nouvelle - Paris 3-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS)-Université Paris sciences et lettres (PSL)-Département Littératures et langage (LILA)
Landragin, Frédéric
DEscription et MOdélisation des Chaînes de Référence : outils pour l'Annotation de corpus (en diachronie et en langues comparées) et le Traitement automatique - - DEMOCRAT2015 - ANR-15-CE38-0008 - AAPG2015 - VALID
Source :
Journées internationales d'Analyse statistique des Données Textuelles (JADT), Journées internationales d'Analyse statistique des Données Textuelles (JADT), Jun 2016, Nice, France. pp.109-120
Publication Year :
2016
Publisher :
HAL CCSD, 2016.

Abstract

Being the result of a manual or an automatic annotation procedure, a coreference chain groups a set of referring expressions that all refer to the same entity. A chain can cover the whole text and therefore contributes to its coherence. Each mention may be annotated with linguistic interpretations. Moreover, relations (that can be annotated, too) may exist between mentions. As a consequence, one can find difficult to apprehend and quickly analyze a chain. In this paper, we present a tool for visualizing coreference chains and for detecting relevant phenomena like patterns in referential transitions. We propose a general methodology for coreference analysis, and we illustrate it with the results of preliminary tests using short texts. Then, we discuss the interests of such a tool for text analytics and textometry, and we identify links with existing works that can lead to a future version of our tool.<br />Qu'elle soit le résultat d'une annotation manuelle ou automatique, une chaîne de coréférence est une structure qui regroupe un ensemble d'expressions référentielles désignant toute la même entité. Une chaîne peut s'étendre tout le long d'un texte et contribuer ainsi à sa cohérence. Chaque expression (ou maillon) peut être enrichie d'annotations linguistiques, et les différents maillons d'une chaîne peuvent être reliés par des relations, elles-mêmes annotées avec des interprétations linguistiques. En conséquence, il est difficile d'appréhender cognitivement une telle structure et d'en tirer directement des analyses. Dans cet article, nous présentons un outil pour visualiser des chaînes de coréférences et pour repérer des phénomènes remarquables tels que des motifs dans les transitions référentielles. Nous proposons une méthodologie pour analyser les coréférences et les transitions référentielles, que nous illustrons avec les résultats de tests effectués sur des textes courts. Nous discutons alors les intérêts de cette méthodologie et de notre outil pour le domaine de l'analyse des données textuelles et de la textométrie. Nous identifions notamment un ensemble de liens avec des travaux existants qui pourront permettre d'envisager des perspectives de recherche ainsi qu'une prochaine version de notre outil.

Details

Language :
French
Database :
OpenAIRE
Journal :
Journées internationales d'Analyse statistique des Données Textuelles (JADT), Journées internationales d'Analyse statistique des Données Textuelles (JADT), Jun 2016, Nice, France. pp.109-120
Accession number :
edsair.dedup.wf.001..8bf9c4a92df2e9a47917d8ca3350fb22