Back to Search Start Over

Similarité surfacique et similarité sémantique dans des cas cliniques générés

Authors :
Hiebel, Nicolas
Ferret, Olivier
Fort, Karën
Névéol, Aurélie
Université Paris-Saclay
Centre National de la Recherche Scientifique (CNRS)
Laboratoire Interdisciplinaire des Sciences du Numérique (LISN)
Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
Sciences et Technologies des Langues (STL)
Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
Département Intelligence Ambiante et Systèmes Interactifs (DIASI)
Laboratoire d'Intégration des Systèmes et des Technologies (LIST (CEA))
Direction de Recherche Technologique (CEA) (DRT (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Technologique (CEA) (DRT (CEA))
Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay
Semantic Analysis of Natural Language (SEMAGRAMME)
Inria Nancy - Grand Est
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Department of Natural Language Processing & Knowledge Discovery (LORIA - NLPKD)
Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)
Sorbonne Université (SU)
ANR-20-CE23-0026,CODEINE,Création éthique de données textuelles artificielles : Synthèse Automatique de documents Hospitaliers(2020)
Source :
Journée d'étude sur la Similarité entre Patients, ATALA, SimPa 2023, Journée d'étude sur la Similarité entre Patients, ATALA, SimPa 2023, Mar 2023, Paris, France
Publication Year :
2023
Publisher :
HAL CCSD, 2023.

Abstract

National audience; La disponibilité restreinte des documents cliniques est un frein à la recherche en traitement automatique de la langue dans le domaine médical. Les corpus cliniques dont l'accès est relativement facile en français (E3C (Magnini et al., 2020), CAS (Grabar et al., 2018)) ne sont pas tout à fait représentatifs des documents confidentiels présents dans les hôpitaux. Le partage des connaissances au sein de la communauté scientifique est compliqué. Aucune reproductibilité n'est possible, tout comme les comparaisons avec d'autres méthodes / données. Une piste de création de ressource partageable en substitut des données confidentielles est la génération de données similaires à ces données privées. Cela pourrait permettre à des personnes ayant accès à un corpus privé de générer un corpus librement distribué à partir du premier. En partageant la méthode de génération, il serait également possible de reproduire l'expérience sur d'autres données confidentielles. La mise à disposition des données générées donnerait alors à la communauté scientifique un terrain de test, de comparaison, de discussion et d'entraide dans la recherche en TAL biomédical. Nous proposons ici une méthode d'évaluation de textes cliniques générés à base de plongements de phrases.

Details

Language :
French
Database :
OpenAIRE
Journal :
Journée d'étude sur la Similarité entre Patients, ATALA, SimPa 2023, Journée d'étude sur la Similarité entre Patients, ATALA, SimPa 2023, Mar 2023, Paris, France
Accession number :
edsair.dedup.wf.001..6f0ef2960b84a23f79453909e01cc0d7