1. Exploitation de syntagmes dans la découverte de thèmes
- Author
-
Delamaire, Amaury, Beigbeder, Michel, Juganaru-Mathieu, Mihaela, École des Mines de Saint-Étienne (Mines Saint-Étienne MSE), Institut Mines-Télécom [Paris] (IMT), Laboratoire Hubert Curien [Saint Etienne] (LHC), Institut d'Optique Graduate School (IOGS)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS), Institut Henri Fayol (FAYOL-ENSMSE), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT), Département Informatique et systèmes intelligents ( FAYOL-ENSMSE), and Ecole Nationale Supérieure des Mines de St Etienne
- Subjects
TALN ,[INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR] ,[INFO]Computer Science [cs] ,Modèle de thèmes ,Classification non supervisée ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation - Abstract
International audience; Le but de cet article est d'étudier l'apport des syntagmes nominaux, verbaux et ad- jectivaux pour la découverte de thèmes ( topic modeling). Nous testons l'hypothèse qu'ajouter des syntagmes à la représentation des documents-- pour lesquels ne sont traditionnellement considérés que les mots simples-- permettrait d'améliorer la qualité d'un modèle de thèmes, en l'occurrence LDA. Des différences significatives sont attendues notamment lorsque plusieurs thèmes partagent le même vocabulaire. Nous présentons des résultats sur un corpus catégorisé de 20 000 résumés d'articles scientifiques. Il s'agit d'une étude de cas qu'il conviendrait de reproduire sur un corpus plus conséquent.
- Published
- 2019
- Full Text
- View/download PDF