Back to Search
Start Over
Analyse syntaxique à l’aide des tables du Lexique-Grammaire du français
- Source :
- Lingvisticae Investigationes, Lingvisticae Investigationes, Philadelphia; Amsterdam: John Benjamins, 2012, 35 (1), pp.147-151. ⟨10.1075/li.35.1.07tol⟩
- Publication Year :
- 2012
- Publisher :
- HAL CCSD, 2012.
-
Abstract
- Les tables du Lexique-Grammaire, dont le developpement a ete initie par Gross (1975), constituent un lexique syntaxique tres riche pour le francais. Elles couvrent diverses categories lexicales telles que les verbes, les noms, les adjectifs et les adverbes. Cette base de donnees linguistiques n'est cependant pas directement exploitable informatiquement car elle est incomplete et manque de coherence. Chaque table regroupe un certain nombre d'entrees jugees similaires car elles acceptent des proprietes communes. Ces proprietes ont pour particularite de ne pas etre codees dans les tables meme mais uniquement decrites dans la litterature. Pour rendre ces tables exploitables, il faut expliciter les proprietes intervenant dans chacune d'entre elles. De plus, un grand nombre de ces proprietes doivent etre renommees dans un souci de coherence. Notre objectif est d'adapter les tables pour les rendre utilisables dans diverses applications de Traitement Automatique des Langues (TAL), notamment l'analyse syntaxique. Nous expliquons les problemes rencontres et les methodes adoptees pour permettre leur integration dans un analyseur syntaxique. Nous proposons LGExtract, un outil generique pour generer un lexique syntaxique pour le TAL a partir des tables du Lexique-Grammaire. Il est relie a une table globale dans laquelle nous avons ajoute les proprietes manquantes et un unique script d'extraction incluant toutes les operations liees a chaque propriete devant etre effectuees pour toutes les tables. Nous presentons egalement LGLex, le nouveau lexique syntaxique genere des verbes, des noms predicatifs, des expressions figees et des adverbes. Ensuite, nous montrons comment nous avons converti les verbes et les noms predicatifs de ce lexique au format Alexina, qui est celui du lexique Lefff (Lexique des Formes Flechies du Francais) (Sagot, 2010), un lexique morphologique et syntaxique a large couverture et librement disponible pour le francais. Ceci permet son integration dans l'analyseur syntaxique FRMG (French MetaGrammar) (Thomasset et de La Clergerie, 2005), un analyseur profond a large couverture pour le francais, base sur les grammaires d'arbres adjoints (TAG), reposant habituellement sur le Lefff. Cette etape de conversion consiste a extraire l'information syntaxique codee dans les tables du Lexique-Grammaire. Nous presentons les fondements linguistiques de ce processus de conversion et le lexique obtenu. Nous evaluons l'analyseur syntaxique FRMG sur le corpus de reference de la campagne d'evaluation d'analyseurs du francais Passage (Produire des Annotations Syntaxiques a Grande Echelle) (Hamon et al., 2008), en comparant sa version basee sur le Lefff avec notre version reposant sur les tables du Lexique-Grammaire converties
- Subjects :
- 060201 languages & linguistics
Parsing
Linguistics and Language
Syntactic Parsing
Analyse syntaxique
Base de données lexicales
Lexicon-Grammar
06 humanities and the arts
02 engineering and technology
Lexique-grammaire
Dictionary
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]
Lexical Database
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
Syntax and semantics
Symbolic Parser
Syntaxe et sémantique
Approche symbolique
0602 languages and literature
0202 electrical engineering, electronic engineering, information engineering
Dictionnaire
020201 artificial intelligence & image processing
[SHS.LANGUE]Humanities and Social Sciences/Linguistics
Base de données lexicale
Subjects
Details
- Language :
- French
- ISSN :
- 03784169 and 15699927
- Database :
- OpenAIRE
- Journal :
- Lingvisticae Investigationes, Lingvisticae Investigationes, Philadelphia; Amsterdam: John Benjamins, 2012, 35 (1), pp.147-151. ⟨10.1075/li.35.1.07tol⟩
- Accession number :
- edsair.doi.dedup.....3a98d6bf01dda11cd7d050731be7c617
- Full Text :
- https://doi.org/10.1075/li.35.1.07tol⟩