1. Inclusion lexicale et proximité sémantique entre termes
- Author
-
Ibekwe-Sanjuan, Fidelia, Ibekwe, Fidelia, Equipe de recherche de Lyon en sciences de l'information et de la communication (ELICO), Université Lumière - Lyon 2 (UL2)-École nationale supérieure des sciences de l'information et des bibliothèques (ENSSIB), Université de Lyon-Université de Lyon-Sciences Po Lyon - Institut d'études politiques de Lyon (IEP Lyon), Université de Lyon-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon, Sciences Po Lyon - Institut d'études politiques de Lyon (IEP Lyon), Université de Lyon-Université de Lyon-École nationale supérieure des sciences de l'information et des bibliothèques (ENSSIB), and Université de Lyon-Université Lumière - Lyon 2 (UL2)
- Subjects
proximité sémantique ,science and technology watch ,[SHS.INFO.INGE]Humanities and Social Sciences/Library and information sciences/domain_shs.info.inge ,[SHS.INFO]Humanities and Social Sciences/Library and information sciences ,[SHS.INFO.GEST] Humanities and Social Sciences/Library and information sciences/domain_shs.info.gest ,semantic term proximity ,veille scientifique et technologique ,[SHS.INFO.GEST]Humanities and Social Sciences/Library and information sciences/domain_shs.info.gest ,acquisition de relations sémantiques ,[SHS.INFO] Humanities and Social Sciences/Library and information sciences ,proximité sémantique ,acquisition de relations sémantiques ,semantic relations acquisition ,[SHS.INFO.INGE] Humanities and Social Sciences/Library and information sciences/domain_shs.info.inge ,agrégats semantiques ,inclusion lexicale ,lexical inclusion ,semantic clusters - Abstract
We study the influence of lexical subsumption on the semantic proximity of terms. By studying the semantic relation between lexically subsumed terms in an existing controlled vocabulary and those in a corpus, we formulate hypotheses on the underlying specific relations. These hypotheses enable us to propose an ordering of term variants found in the corpus, by probability of decreasing semantic proximity. Results from our experiment show that surface indices like the presence of proper names, compounds and the number of added words in a term variant are criteria for ordering the variants of the same term. The ranking obtained will enable us to form more semantically-cohesive clusters. Applications targeted are text mining, question-answering and science and technology watch., Nous étudions l'influence de l'inclusion lexicale sur la proximité sémantique entre termes. A partir de l'analyse des relations entre termes d'une ressource terminologique existante, lexicalement inclus dans ceux issus d'un corpus, nous formulons des hypothèses des relations engendrées. Ces hypothèses nous permettent de proposer un ordonnancement automatique des variantes des termes trouvées dans le corpus, par probabilité de proximité sémantique décroissante. Les premières expérimentations montrent que la prise en compte d'indices morpho-lexicaux comme la présence de noms composés, de noms propres et le nombre d'éléments ajoutés sont des critères à prendre en compte pour classer les variantes d'un même terme. L'ordonnancement obtenu permettra de former des classes de termes sémantiquement homogènes. Les applications visées sont la fouille de textes, la veille scientifique et technologique, la reformulation des requêtes.
- Published
- 2005