Back to Search Start Over

Is Old French tougher to parse?

Authors :
Grobol, Loïc
Prévost, Sophie
Crabbé, Benoît
Modèles, Dynamiques, Corpus (MoDyCo)
Université Paris Nanterre (UPN)-Centre National de la Recherche Scientifique (CNRS)
Laboratoire d'Informatique Fondamentale d'Orléans (LIFO)
Université d'Orléans (UO)-Institut National des Sciences Appliquées - Centre Val de Loire (INSA CVL)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)
Centre National de la Recherche Scientifique (CNRS)
Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094 (Lattice)
Département Littératures et langage - ENS Paris (LILA)
École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS Paris)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS)-Université Sorbonne Paris Cité (USPC)-Université Sorbonne Nouvelle - Paris 3
Centre d’étude de la langue et des littératures françaises (CELLF)
Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS)
Université Sorbonne Nouvelle - Paris 3-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS)-Université Paris sciences et lettres (PSL)-Département Littératures et langage - ENS Paris (LILA)
École normale supérieure - Paris (ENS-PSL)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-École normale supérieure - Paris (ENS-PSL)
Université Paris sciences et lettres (PSL)
Source :
20th International Workshop on Treebanks and Linguistic Theories, 20th International Workshop on Treebanks and Linguistic Theories, Mar 2022, Sofia, Bulgaria
Publication Year :
2022
Publisher :
HAL CCSD, 2022.

Abstract

International audience; Medieval French is known to be relatively hard to parse, with several possible sources of confusion for automatic parsers, among which its flexible word order and its graphical and syntactic variation, both synchronically and diachronically. In this work, we study in particular the influence of word order, by comparing the performances of two state-of-the-art syntactic parsers trained and evaluated on two treebanks: the Syntactic Reference Corpus of Medieval French (SRCMF), a treebank of Old French (9th-13th century) and the Google Stanford Dependency treebank of contemporary French.

Details

Language :
English
Database :
OpenAIRE
Journal :
20th International Workshop on Treebanks and Linguistic Theories, 20th International Workshop on Treebanks and Linguistic Theories, Mar 2022, Sofia, Bulgaria
Accession number :
edsair.dedup.wf.001..9af3c62a7b2d6b09b6ed71f64ed35c9e