Back to Search
Start Over
Similarité surfacique et similarité sémantique dans des cas cliniques générés
- Source :
- Journée d'étude sur la Similarité entre Patients, ATALA, SimPa 2023, Journée d'étude sur la Similarité entre Patients, ATALA, SimPa 2023, Mar 2023, Paris, France
- Publication Year :
- 2023
- Publisher :
- HAL CCSD, 2023.
-
Abstract
- National audience; La disponibilité restreinte des documents cliniques est un frein à la recherche en traitement automatique de la langue dans le domaine médical. Les corpus cliniques dont l'accès est relativement facile en français (E3C (Magnini et al., 2020), CAS (Grabar et al., 2018)) ne sont pas tout à fait représentatifs des documents confidentiels présents dans les hôpitaux. Le partage des connaissances au sein de la communauté scientifique est compliqué. Aucune reproductibilité n'est possible, tout comme les comparaisons avec d'autres méthodes / données. Une piste de création de ressource partageable en substitut des données confidentielles est la génération de données similaires à ces données privées. Cela pourrait permettre à des personnes ayant accès à un corpus privé de générer un corpus librement distribué à partir du premier. En partageant la méthode de génération, il serait également possible de reproduire l'expérience sur d'autres données confidentielles. La mise à disposition des données générées donnerait alors à la communauté scientifique un terrain de test, de comparaison, de discussion et d'entraide dans la recherche en TAL biomédical. Nous proposons ici une méthode d'évaluation de textes cliniques générés à base de plongements de phrases.
Details
- Language :
- French
- Database :
- OpenAIRE
- Journal :
- Journée d'étude sur la Similarité entre Patients, ATALA, SimPa 2023, Journée d'étude sur la Similarité entre Patients, ATALA, SimPa 2023, Mar 2023, Paris, France
- Accession number :
- edsair.dedup.wf.001..6f0ef2960b84a23f79453909e01cc0d7