Back to Search Start Over

De quoi parlent les patients dans les forums de santé : classification non-supervisée par LDA

Authors :
Tapi Nzali, Mike Donald
Bringay, Sandra
Lavergne, Christian
Mollevi, Caroline
ADVanced Analytics for data SciencE (ADVANSE)
Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM)
Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)
Institut Montpelliérain Alexander Grothendieck (IMAG)
Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)
Université de Montpellier (UM)
Université Paul-Valéry - Montpellier 3 (UPVM)
UNICANCER - Institut régional du Cancer Montpellier Val d'Aurelle (ICM)
CRLCC Val d'Aurelle - Paul Lamarque
Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)
Source :
48èmes Journées de Statistique de la SFdS, 48èmes Journées de Statistique de la SFdS, May 2016, Montpellier, France
Publication Year :
2016
Publisher :
HAL CCSD, 2016.

Abstract

National audience; Nowadays, social media is increasingly used by patients and health professionals. This is a rich text resource, generated by many exchanges between patients and in some cases health professionals. In this paper, we use unsupervised learning model known as LDA (Latent Dirichlet Allocation) to detect the different topics on health forums and social networks discussed by patients. Our main objective is to detect the different themes by patients during their accounts in social media and compare them with predefined themes existing in the questionnaires used in clinical trials. We also show pretreatments to be performed on these data for such tasks.; De nos jours, les médias sociaux sont de plus en plus utilisés par les patients et les professionnels de santé. Il s'agit d'une ressource textuelle riche, générée par les très nombreux échanges entre patients et, dans certains cas, professionnels de santé. Dans cet article, nous utilisons le modèle d'apprentissage non supervisé connu sous le nom de LDA (Allocation de Dirichlet Latente) afin de détecter les différents thèmes abordés sur les forums de santé et les réseaux sociaux par les patients. Notre objectif est de repérer les nouveaux thèmes directement issus des préoccupations des patientes atteintes de cancer du sein et de les comparer aux thèmes existant dans les auto-questionnaires proposés dans les essais cliniques en oncologie. Mots

Details

Language :
French
Database :
OpenAIRE
Journal :
48èmes Journées de Statistique de la SFdS, 48èmes Journées de Statistique de la SFdS, May 2016, Montpellier, France
Accession number :
edsair.dedup.wf.001..34c67b4d258d3a6214d4f280fd3a05fb