Back to Search Start Over

Retweeter ou ne pas retweeter

Authors :
Palmer, Thomas
Hubert, Gilles
Pinel-Sauvagnat, Karen
Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
Centre National de la Recherche Scientifique - CNRS (FRANCE)
Université Toulouse III - Paul Sabatier - UT3 (FRANCE)
Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université Toulouse 1 Capitole - UT1 (FRANCE)
Recherche d’Information et Synthèse d’Information (IRIT-IRIS)
Institut de recherche en informatique de Toulouse (IRIT)
Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP)
Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées
Institut National Polytechnique de Toulouse - INPT (FRANCE)
Source :
Document Numérique, Document Numérique, Lavoisier, 2018, 21 (3), pp.81-103. ⟨10.3166/DN.21.3.81-103⟩
Publication Year :
2018
Publisher :
Lavoisier, 2018.

Abstract

National audience; The study of contextual features has been widely discussed in Information Retrieval (IR), but concrete applications on real data streams are not common. In this paper, we aim at doing retweet recommandation. Considering a user interest, we introduce a model to perform real-time online filtering of the Twitter stream using several contextual features. The model separates content and contextual aspects, achieving a very high velocity. Experiments were performed on the TREC Microblog 2015 and TREC 2016 Real-Time Summarization frameworks. Results show that our model is very efficient as well as effective on the 2015 collection. However, the results regarding effectiveness have not been confirmed on the 2016 framework. This led us to conduct a detailed analysis of the results with regard to our approach and the evaluation framework. This analysis showed an evaluation bias discussed at the end of the article.; L'étude des caractéristiques contextuelles a été largement traitée en Recherche d'Information (RI), mais les applications concrètes sur de vrais flux de données ne sont pas très répandues. Dans cet article, notre problématique concerne la décision automatique de retweeter un message. En considérant le centre d'intérêt d'un utilisateur, nous proposons un modèle pour effectuer un filtrage automatique en temps-réel du flux Twitter en utilisant de multiples caractéristiques contextuelles. Le modèle sépare l'aspect contextuel du contenu du message en lui-même, tout en conservant une très grande vitesse d'exécution. Notre modèle a été évalué dans le cadre des tâches TREC Microblog 2015 et TREC Real-Time Summarization 2016. Les résultats montrent la grande efficience (temps de retweet) de notre modèle, et son efficacité sur les mesures de 2015. Ces résultats en termes d'efficacité n'ont cependant pas été confirmés sur 2016. Ceci nous a conduit à une analyse plus en détail des résultats (approche et cadre d'évaluation). Cette analyse a notamment montré un biais dans l'évaluation, biais que nous discutons à la fin de l'article.

Details

Language :
English
ISSN :
12795127 and 19631014
Database :
OpenAIRE
Journal :
Document Numérique, Document Numérique, Lavoisier, 2018, 21 (3), pp.81-103. ⟨10.3166/DN.21.3.81-103⟩
Accession number :
edsair.dedup.wf.001..b2fbf18390fe5eba311e3ee9e98d0205
Full Text :
https://doi.org/10.3166/DN.21.3.81-103⟩