Back to Search Start Over

Addressing the Challenge of Online Health Misinformation: Detection, Retrieval, and Explainability

Authors :
Upadhyay, R
VIVIANI, MARCO
UPADHYAY, RISHABH GYANENDRA
Upadhyay, R
VIVIANI, MARCO
UPADHYAY, RISHABH GYANENDRA
Publication Year :
2024

Abstract

In today’s digital age, online platforms serve as a primary conduit for individuals seeking health-related information. While the web provides a vast repository of health knowledge, it has simultaneously birthed a daunting challenge: the proliferation of online health misinformation. This malady, when unchecked, poses serious repercussions for public health, as individuals, often untrained in medical nuances, make health decisions based on misleading or outright false information. Addressing this pressing concern, my thesis delves deep into understanding and mitigating the challenge of Online Health Misinformation, exploring avenues of detection, retrieval, and explainability. Our research journey began with a focus on the detection of health misinformation, by utilizing structural, content, and context-aware strategies. This new model was uniquely poised to assess the truthfulness of online health content. By exploiting a specialized medical lexicon, the model crafted embedded representations of web pages, thereby comprehending subtle nuances associated with health misinformation. The innovation lay in the model’s capability to also consider URLs embedded within these pages, which proved instrumental in the classification effort. Moreover, the strategic inclusion of a domain-specific pre-trained representation considerably amplified the model’s efficiency. In the subsequent phase, we built upon these foundational findings to birth the Vec4Cred model - an advanced approach tailored explicitly for detecting health misinformation online. Vec4Cred was underscored by a multi-layered framework, focusing on embedding representations of various web page attributes. The model’s prowess lay in its capacity to seamlessly integrate embedding representations from parts-of-speech tags and keywords from linked pages. Forward-looking, the model beckons enhancement through advanced contextual embedding methodologies, thereby continually refining its accuracy in misinformation detec<br />Nell’odierna epoca digitale, le piattaforme online costituiscono uno dei mezzi principali utilizzati dalle persone per cercare informazioni relative alla propria salute. Nonostante il web sia un vasto repository di conoscenze in tale ambito, è affetto dal problema dalla proliferazione e diffusione di disinformazione sanitaria (health misinformation). Questo problema può portare a gravi ripercussioni per la salute pubblica, poiché gli individui possono assumere decisioni basate su informazioni fuorvianti o palesemente false. Questa tesi di dottorato propone quindi tecniche per la mitigazione della disinformazione sanitaria online, affrontando in particolare i problemi della sua identificazione, del reperimento di informazione affidabile e della spiegabilità (explainability) degli algoritmi proposti. Il lavoro di ricerca è iniziato concentrandosi sull’idendificazione della dinsinformazione sanitaria, definendo un modello basato su aspetti topologici, contenutistici e contestuali delle pagine web. Sfruttando un lessico medico specializzato, il modello ha creato rappresentazioni embedded delle pagine. Il modello ha quindi la capacità di considerare, oltre ad altre feature lessicali, anche gli URL incorporati, che si sono rivelati strumentali nello task di classificazione. Le valutazioni comparative hanno dimostrato la superiorità del modello rispetto alle tecniche tradizionali di machine learning. Inoltre, l'inclusione di una rappresentazione pre-addestrata specifica del dominio ha notevolmente amplificato l'efficacia del modello. Si è poi sviluppato il modello Vec4Cred, la cui caratteristica principale è quella di integrare rappresentazioni embedded da parti del discorso e parole chiave delle pagine collegate. I risultati sperimentali hanno confermato la bontà del modello nell'identificare la disinformazione sulla salute online, sottolineando la sua adattabilità ed efficacia. Il reperimento di informazioni sanitarie veritiere costituisce un’altra fase di que

Details

Database :
OAIster
Notes :
English
Publication Type :
Electronic Resource
Accession number :
edsoai.on1427431810
Document Type :
Electronic Resource