7 results on '"Base de donnees lexicales"'
Search Results
2. Analyse syntaxique à l’aide des tables du Lexique-Grammaire du français
- Author
-
Elsa Tolone, Laboratoire d'Informatique Gaspard-Monge (LIGM), and Centre National de la Recherche Scientifique (CNRS)-Fédération de Recherche Bézout-ESIEE Paris-École des Ponts ParisTech (ENPC)-Université Paris-Est Marne-la-Vallée (UPEM)
- Subjects
060201 languages & linguistics ,Parsing ,Linguistics and Language ,Syntactic Parsing ,Analyse syntaxique ,Base de données lexicales ,Lexicon-Grammar ,06 humanities and the arts ,02 engineering and technology ,Lexique-grammaire ,Dictionary ,[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL] ,Lexical Database ,[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing ,Syntax and semantics ,Symbolic Parser ,Syntaxe et sémantique ,Approche symbolique ,0602 languages and literature ,0202 electrical engineering, electronic engineering, information engineering ,Dictionnaire ,020201 artificial intelligence & image processing ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,Base de données lexicale - Abstract
Les tables du Lexique-Grammaire, dont le developpement a ete initie par Gross (1975), constituent un lexique syntaxique tres riche pour le francais. Elles couvrent diverses categories lexicales telles que les verbes, les noms, les adjectifs et les adverbes. Cette base de donnees linguistiques n'est cependant pas directement exploitable informatiquement car elle est incomplete et manque de coherence. Chaque table regroupe un certain nombre d'entrees jugees similaires car elles acceptent des proprietes communes. Ces proprietes ont pour particularite de ne pas etre codees dans les tables meme mais uniquement decrites dans la litterature. Pour rendre ces tables exploitables, il faut expliciter les proprietes intervenant dans chacune d'entre elles. De plus, un grand nombre de ces proprietes doivent etre renommees dans un souci de coherence. Notre objectif est d'adapter les tables pour les rendre utilisables dans diverses applications de Traitement Automatique des Langues (TAL), notamment l'analyse syntaxique. Nous expliquons les problemes rencontres et les methodes adoptees pour permettre leur integration dans un analyseur syntaxique. Nous proposons LGExtract, un outil generique pour generer un lexique syntaxique pour le TAL a partir des tables du Lexique-Grammaire. Il est relie a une table globale dans laquelle nous avons ajoute les proprietes manquantes et un unique script d'extraction incluant toutes les operations liees a chaque propriete devant etre effectuees pour toutes les tables. Nous presentons egalement LGLex, le nouveau lexique syntaxique genere des verbes, des noms predicatifs, des expressions figees et des adverbes. Ensuite, nous montrons comment nous avons converti les verbes et les noms predicatifs de ce lexique au format Alexina, qui est celui du lexique Lefff (Lexique des Formes Flechies du Francais) (Sagot, 2010), un lexique morphologique et syntaxique a large couverture et librement disponible pour le francais. Ceci permet son integration dans l'analyseur syntaxique FRMG (French MetaGrammar) (Thomasset et de La Clergerie, 2005), un analyseur profond a large couverture pour le francais, base sur les grammaires d'arbres adjoints (TAG), reposant habituellement sur le Lefff. Cette etape de conversion consiste a extraire l'information syntaxique codee dans les tables du Lexique-Grammaire. Nous presentons les fondements linguistiques de ce processus de conversion et le lexique obtenu. Nous evaluons l'analyseur syntaxique FRMG sur le corpus de reference de la campagne d'evaluation d'analyseurs du francais Passage (Produire des Annotations Syntaxiques a Grande Echelle) (Hamon et al., 2008), en comparant sa version basee sur le Lefff avec notre version reposant sur les tables du Lexique-Grammaire converties
- Published
- 2012
- Full Text
- View/download PDF
3. Compositionnalité morpho-phonétique de la Langue des Signes Française (LSF) et exploration des relations structurales entre paramètres
- Author
-
Dominique Boutet, Brigitte Garcia, Université d'Évry-Val-d'Essonne (UEVE), Structures Formelles du Langage (SFL), Université Paris 8 Vincennes-Saint-Denis (UP8)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Lumières (UPL), financement RIAM puis ANR, Garcia, Brigitte, Dominique Boutet, and Boutet, Dominique
- Subjects
base de données ,langue des signes française ,phonétique ,phonetics ,structuration morphophonétique ,physiologie ,lexical signs ,iconicity ,French Sign Language ,signes lexicaux ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,base de données lexicales ,lexical database ,LSF ,physiology ,iconicité ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,morpho-phonetic structuring ,ComputingMilieux_MISCELLANEOUS ,database - Abstract
Cuxac's Model predicts that each sign of the LSF lexicon is a combination of morphemic rather than phonemic values. This paper exposes the theoretical principles and conditions of falsifiability we propose to constitute an inventory of morphemic values, their assignation to the parametric components and, in fine, to establish which role is played by the different kinds of constraints exerted on lexical signs. The results we present come from the exploitation of a database including the whole standard signs of LSF. In this database, morphemic, parametric and infraparametric analysis is realized according to different frames of reference and points of view (ego/allocentric ; visual/physiological), leading to an original modellisation. These results corroborate the hypothesis of morphemic compositionality but they call into question the nature and status of current parameters and those of their mutual interdependencies., Cuxac fait l'hypothèse d'une organisation morphémique plutôt que phonémique des signes lexicaux en LSF. Cet article expose les principes théoriques et les conditions de falsiabilité mises en œuvre pour inventorier ces valeurs morphémiques et leur assigner un corrélat formel pour, finalement, préciser la part respective des contraintes en jeu dans la structuration des signes. Les résultats présentés proviennent d'une base de données intégrant l'ensemble des signes standard recensés et pour laquelle les descriptions morphémiques, paramétriques et infraparamétriques sont effectuées selon plusieurs référentiels et points de vue (ego et allocentrés, visuels et physiologiques), aboutissant ainsi à une modélisation originale de l'ensemble. S'ils corroborent l'hypothèse d'une compositionnalité morphémique, ces résultats interrogent la nature des paramètres classiquement retenus, du fait des liens d'interdépendance qu'ils entretiennent.
- Published
- 2009
4. CHACQFAM : une base de données renseignant l'âge d'acquisition estimé et la familiarité pour 1225 mots monosyllabiques et bisyllabiques du Français
- Author
-
Lachaud, Christian, Laboratoire de Psycholinguistique Expérimentale (FAPSE), University of Geneva [Switzerland], and Lachaud, Christian
- Subjects
[SHS.PSY] Humanities and Social Sciences/Psychology ,CHACQFAM ,familiarity ,lexical database ,familiarité ,age of acquisition ,French ,âge d'acquisition ,[SHS.PSY]Humanities and Social Sciences/Psychology ,base de données lexicales ,Français - Abstract
The age of acquisition and familiarity of a word are crucial for lexical access, in production as well as in perception. To promote research into the mechanisms of lexical processing in French, a lexical database has been established for a corpus of 1225 monosyllabic and bisyllabic French words. This article describes the method used for data collection, the raw information obtained, the procedure for dealing with this raw information, and the content of the database CHACQFAM obtained after processing the raw information, as well as the validation procedures of this content. CHACQFAM can be downloaded on this open archive., L'âge d'acquisition et la familiarité d'un mot sont des facteurs décisifs pour l'accès au lexique, en production comme en perception. Pour favoriser les recherches sur les mécanismes du traitement lexical en Français, une base de données lexicales a été constituée pour un corpus de 1225 mots monosyllabiques et bisyllabiques du Français. Cet article décrit la méthode utilisée pour le recueil des données, l'information brute obtenue, la procédure pour traiter cette information brute, et le contenu de la base de données CHACQFAM obtenu après traitement de l'information brute, ainsi que les procédures de validation de ce contenu. CHACQFAM peut être téléchargée depuis cette archive.
- Published
- 2007
5. UMLF: construction d'un lexique médical francophone unifié
- Author
-
Pierre Zweigenbaum, Robert Baud, Anita Burgun, Fiammetta Namer, Eric Jarousse, Natalia Grabar, Patrick Ruch, Franck Le Duff, Benoît Thirion, Darmoni, Stéfan J., Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI), Université Paris Saclay (COmUE)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université - UFR d'Ingénierie (UFR 919), Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Université Paris-Sud - Paris 11 (UP11), Service d'informatique médicale (SIM), Hôpitaux de Genève, Laboratoire d'Informatique Médicale (LIM), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES), Analyse et Traitement Informatique de la Langue Française (ATILF), Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), Ingenierie des connaissances en santé, IFR58-Université Paris Descartes - Paris 5 (UPD5)-Institut National de la Santé et de la Recherche Médicale (INSERM), L@STICS, CHU Rouen, Normandie Université (NU)-Normandie Université (NU), Université de Rennes (UR), Direction des systèmes d'information (DSI), Centre National de la Recherche Scientifique (CNRS), Université Paris-Sud - Paris 11 (UP11)-Sorbonne Université - UFR d'Ingénierie (UFR 919), Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université Paris Saclay (COmUE), Université Paris-Sud - Paris 11 (UP11)-Université Paris-Saclay-Sorbonne Université - UFR d'Ingénierie (UFR 919), Sorbonne Université (SU)-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Saclay (COmUE), Namer, Fiammetta, Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur ( LIMSI ), Université Paris-Sud - Paris 11 ( UP11 ) -Centre National de la Recherche Scientifique ( CNRS ), Service d'informatique médicale ( SIM ), Laboratoire d'Informatique Médicale ( LIM ), Université de Rennes 1 ( UR1 ), Université de Rennes ( UNIV-RENNES ) -Université de Rennes ( UNIV-RENNES ), Analyse et Traitement Informatique de la Langue Française ( ATILF ), Université de Lorraine ( UL ) -Centre National de la Recherche Scientifique ( CNRS ), and IFR58-Université Paris Descartes - Paris 5 ( UPD5 ) -Institut National de la Santé et de la Recherche Médicale ( INSERM )
- Subjects
lexicologie ,morphologie flexionnelle ,traitement automatique des langues ,domaines techniques ,[ SHS.LANGUE ] Humanities and Social Sciences/Linguistics ,français ,vocabulaire contrôlé ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,médecine ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,lexique médical ,base de données lexicales - Published
- 2003
6. Sublim: A Universal Lexical Database Manager and Nadia: its Specialisation for Acception Based Interlingual Lexical Database
- Author
-
Serasset, Gilles, GETA / IMAG, Université Joseph Fourier - Grenoble 1 (UJF), Université Joseph-Fourier - Grenoble I, and Boitet Christian
- Subjects
Lexical architecture ,Architecture linguistique ,Electronic dictionary ,Multilinguism ,CLOS ,Dictionnaire electronique ,Architecture lexicale ,Representation de connaissances ,Base de donnees lexicales ,Knowledge representation ,Interlingua ,Lisp ,Lexical database ,Multilinguisme ,[INFO.INFO-HC]Computer Science [cs]/Human-Computer Interaction [cs.HC] ,Linguistic architecture - Abstract
The aim of this thesis is the definition and development of a multilingual lexical database manager independent from the applications and linguistic theories. It begins with the study of some dictionaries (printed or electronic) and some tools for the management of lexical databases, like, notably, the MULTILEX ESPRIT project, considered as the most advanced effort, although it presents some limitations (transfer-based lexical architecture, linguistic structures coded as feature structures, etc.). The second part of this thesis is dedicated to the definition of SUBLIM, a multilingual lexical database management system which allows the specification of the lexical architecture (organization of the dictionaries), and of the linguistic architecture (organization of the linguistic information inside the dictionaries). This system does not constrain the kind of dictionaries or linguistic structures to be used. The third part of the thesis presents a specialization of this generic system for the management of multilingual lexical databases based on interlingual acceptions: NADIA. This approach is a generalization of some interlingual methods, as the one used in the ULTRA translation system, and an alternative to the knowledge based approach.; Le but de cette these est de definir et developper un systeme de bases lexicales multilingues independant des applications et des theories linguistiques. Elle debute donc par une etude des dictionnaires (imprimes ou electroniques) et des outils de gestion de bases lexicales, avec, notamment, le projet ESPRIT MULTILEX, considere comme l'effort le plus avance, mais qui presente quelques faiblesses (architecture lexicale par transfert, structures linguistiques codees sous forme de structures de traits types.). La deuxieme partie de cette these est consacree a la definition de SUBLIM, un systeme de gestion de bases lexicales multilingues qui permet de specifier l'architecture lexicale (organisation des dictionnaires) et l'architecture linguistique (organisation des informations linguistiques des unites des dictionnaires), sans imposer de contraintes ni sur les types de dictionnaires choisis, ni sur les structures linguistiques utilisees. La troisieme et derniere partie de cette these presente une specialisation de ce systeme generique en un systeme dedie a la gestion de bases lexicales multilingues fondees sur les acceptions interlingues : NADIA. Cette approche generalise certaines methodes interlingues comme celle du projet de traduction multilingue ULTRA, et permet la definition de bases lexicales multilingues ne se basant pas sur une approche par connaissances.
- Published
- 1994
7. Sublim : un systeme universel de bases lexicales multilingues et Nadia : sa specialisation aux bases lexicales interlingues par acceptions
- Author
-
Serasset, Gilles, GETA / IMAG, Université Joseph Fourier - Grenoble 1 (UJF), Université Joseph-Fourier - Grenoble I, and Boitet Christian
- Subjects
Lexical architecture ,Architecture linguistique ,Electronic dictionary ,Multilinguism ,CLOS ,Dictionnaire electronique ,Architecture lexicale ,Representation de connaissances ,Base de donnees lexicales ,Knowledge representation ,Interlingua ,Lisp ,Lexical database ,Multilinguisme ,[INFO.INFO-HC]Computer Science [cs]/Human-Computer Interaction [cs.HC] ,Linguistic architecture - Abstract
The aim of this thesis is the definition and development of a multilingual lexical database manager independent from the applications and linguistic theories. It begins with the study of some dictionaries (printed or electronic) and some tools for the management of lexical databases, like, notably, the MULTILEX ESPRIT project, considered as the most advanced effort, although it presents some limitations (transfer-based lexical architecture, linguistic structures coded as feature structures, etc.). The second part of this thesis is dedicated to the definition of SUBLIM, a multilingual lexical database management system which allows the specification of the lexical architecture (organization of the dictionaries), and of the linguistic architecture (organization of the linguistic information inside the dictionaries). This system does not constrain the kind of dictionaries or linguistic structures to be used. The third part of the thesis presents a specialization of this generic system for the management of multilingual lexical databases based on interlingual acceptions: NADIA. This approach is a generalization of some interlingual methods, as the one used in the ULTRA translation system, and an alternative to the knowledge based approach.; Le but de cette these est de definir et developper un systeme de bases lexicales multilingues independant des applications et des theories linguistiques. Elle debute donc par une etude des dictionnaires (imprimes ou electroniques) et des outils de gestion de bases lexicales, avec, notamment, le projet ESPRIT MULTILEX, considere comme l'effort le plus avance, mais qui presente quelques faiblesses (architecture lexicale par transfert, structures linguistiques codees sous forme de structures de traits types.). La deuxieme partie de cette these est consacree a la definition de SUBLIM, un systeme de gestion de bases lexicales multilingues qui permet de specifier l'architecture lexicale (organisation des dictionnaires) et l'architecture linguistique (organisation des informations linguistiques des unites des dictionnaires), sans imposer de contraintes ni sur les types de dictionnaires choisis, ni sur les structures linguistiques utilisees. La troisieme et derniere partie de cette these presente une specialisation de ce systeme generique en un systeme dedie a la gestion de bases lexicales multilingues fondees sur les acceptions interlingues : NADIA. Cette approche generalise certaines methodes interlingues comme celle du projet de traduction multilingue ULTRA, et permet la definition de bases lexicales multilingues ne se basant pas sur une approche par connaissances.
- Published
- 1994
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.