1. Développement d'un lexique morphologique et syntaxique de l'ancien français
- Author
-
Sagot, Benoît, Automatic Language Modelling and ANAlysis & Computational Humanities (ALMAnaCH), Inria de Paris, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), ANR-16-CE38-0010,PROFITEROLE,Modélisation de l'évolution de la langue à partir de textes d'ancien français instrumentés(2016), Sagot, Benoît, and Modélisation de l'évolution de la langue à partir de textes d'ancien français instrumentés - - PROFITEROLE2016 - ANR-16-CE38-0010 - AAPG2016 - VALID
- Subjects
Lexique syntaxique ,[INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL] ,Old French ,Morphological lexicon ,Ancien français ,Syntactic lexicon ,[INFO]Computer Science [cs] ,[INFO] Computer Science [cs] ,[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL] ,Lexique morphologique - Abstract
In this paper we describe our work on the development of a large-scale morphological and syntactic lexicon of Old French for natural language processing. We rely on dictionary and lexical resources, from which the extraction of structured and exploitable information required specific developments. In addition, matching information from these different sources posed difficulties. We provide quantitative information on the resulting lexicon, and discuss its reliability in its current version and the prospects for improvement allowed by the existence of a first version, in particular through the automatic analysis of textual data., Nous décrivons dans cet article notre travail de développement d'un lexique morphologique et syntaxique à grande échelle de l'ancien français pour le traitement automatique des langues. Nous nous sommes appuyés sur des ressources dictionnairiques et lexicales dans lesquelles l'extraction d'informations structurées et exploitables a nécessité des développements spécifiques. De plus, la mise en correspondance d'informations provenant de ces différentes sources a soulevé des difficultés. Nous donnons quelques indications quantitatives sur le lexique obtenu, et discutons de sa fiabilité dans sa version actuelle et des perspectives d'amélioration permises par l'existence d'une première version, notamment au travers de l'analyse automatique de données textuelles.
- Published
- 2019