Back to Search Start Over

Analyse syntaxique à l’aide des tables du Lexique-Grammaire du français

Authors :
Elsa Tolone
Laboratoire d'Informatique Gaspard-Monge (LIGM)
Centre National de la Recherche Scientifique (CNRS)-Fédération de Recherche Bézout-ESIEE Paris-École des Ponts ParisTech (ENPC)-Université Paris-Est Marne-la-Vallée (UPEM)
Source :
Lingvisticae Investigationes, Lingvisticae Investigationes, Philadelphia; Amsterdam: John Benjamins, 2012, 35 (1), pp.147-151. ⟨10.1075/li.35.1.07tol⟩
Publication Year :
2012
Publisher :
HAL CCSD, 2012.

Abstract

Les tables du Lexique-Grammaire, dont le developpement a ete initie par Gross (1975), constituent un lexique syntaxique tres riche pour le francais. Elles couvrent diverses categories lexicales telles que les verbes, les noms, les adjectifs et les adverbes. Cette base de donnees linguistiques n'est cependant pas directement exploitable informatiquement car elle est incomplete et manque de coherence. Chaque table regroupe un certain nombre d'entrees jugees similaires car elles acceptent des proprietes communes. Ces proprietes ont pour particularite de ne pas etre codees dans les tables meme mais uniquement decrites dans la litterature. Pour rendre ces tables exploitables, il faut expliciter les proprietes intervenant dans chacune d'entre elles. De plus, un grand nombre de ces proprietes doivent etre renommees dans un souci de coherence. Notre objectif est d'adapter les tables pour les rendre utilisables dans diverses applications de Traitement Automatique des Langues (TAL), notamment l'analyse syntaxique. Nous expliquons les problemes rencontres et les methodes adoptees pour permettre leur integration dans un analyseur syntaxique. Nous proposons LGExtract, un outil generique pour generer un lexique syntaxique pour le TAL a partir des tables du Lexique-Grammaire. Il est relie a une table globale dans laquelle nous avons ajoute les proprietes manquantes et un unique script d'extraction incluant toutes les operations liees a chaque propriete devant etre effectuees pour toutes les tables. Nous presentons egalement LGLex, le nouveau lexique syntaxique genere des verbes, des noms predicatifs, des expressions figees et des adverbes. Ensuite, nous montrons comment nous avons converti les verbes et les noms predicatifs de ce lexique au format Alexina, qui est celui du lexique Lefff (Lexique des Formes Flechies du Francais) (Sagot, 2010), un lexique morphologique et syntaxique a large couverture et librement disponible pour le francais. Ceci permet son integration dans l'analyseur syntaxique FRMG (French MetaGrammar) (Thomasset et de La Clergerie, 2005), un analyseur profond a large couverture pour le francais, base sur les grammaires d'arbres adjoints (TAG), reposant habituellement sur le Lefff. Cette etape de conversion consiste a extraire l'information syntaxique codee dans les tables du Lexique-Grammaire. Nous presentons les fondements linguistiques de ce processus de conversion et le lexique obtenu. Nous evaluons l'analyseur syntaxique FRMG sur le corpus de reference de la campagne d'evaluation d'analyseurs du francais Passage (Produire des Annotations Syntaxiques a Grande Echelle) (Hamon et al., 2008), en comparant sa version basee sur le Lefff avec notre version reposant sur les tables du Lexique-Grammaire converties

Details

Language :
French
ISSN :
03784169 and 15699927
Database :
OpenAIRE
Journal :
Lingvisticae Investigationes, Lingvisticae Investigationes, Philadelphia; Amsterdam: John Benjamins, 2012, 35 (1), pp.147-151. ⟨10.1075/li.35.1.07tol⟩
Accession number :
edsair.doi.dedup.....3a98d6bf01dda11cd7d050731be7c617
Full Text :
https://doi.org/10.1075/li.35.1.07tol⟩