Back to Search Start Over

Détection des couples de termes translittérés à partir d'un corpus parallèle anglais-arabe

Authors :
Neifar, Wafa
Hamon, Thierry
Zweigenbaum, Pierre
Ellouze Khemakhem, Mariem
Lamia Hadrich Belguith
Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI)
Université Paris Saclay (COmUE)-Centre National de la Recherche Scientifique (CNRS)-Sorbonne Université - UFR d'Ingénierie (UFR 919)
Sorbonne Université (SU)-Sorbonne Université (SU)-Université Paris-Saclay-Université Paris-Sud - Paris 11 (UP11)
Multimedia, InfoRmation systems and Advanced Computing Laboratory (MIRACL)
Faculté des Sciences Economiques et de Gestion de Sfax (FSEG Sfax)
Université de Sfax - University of Sfax-Université de Sfax - University of Sfax
Université Paris 13 (UP13)
Source :
BASE-Bielefeld Academic Search Engine, Conférence sur le Traitement Automatique des Langues Naturelles, Conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France

Abstract

Nous présentons une méthode pour extraire des couples de termes médicaux translittérés de l'anglais en caractères arabes. Nous avons proposé un processus de construction des translittérations de termes anglais en arabe. Celui-ci s'appuie sur une étude en corpus pour la création d'une table de correspondances des caractères anglais en arabe mais aussi sur des règles de conversion qui tiennent compte de certaines particularités de la langue arabe comme l'agglutination et la non-voyellation. Nous avons évalué l'apport de l'utilisation de la translittération pour identifier des couples de termes anglais-arabe sur un corpus parallèle de textes médicaux. Les résultats montrent que parmi 137 couples de mots anglais-arabe extraits, 120 sont jugés corrects (soit 87,59%), dont 107 représentent des couples de termes médicaux (soit 89,16% des translittérations correctes et 78,10% des résultats).

Details

Database :
OpenAIRE
Journal :
BASE-Bielefeld Academic Search Engine, Conférence sur le Traitement Automatique des Langues Naturelles, Conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France
Accession number :
edsair.dedup.wf.001..1cbe4178c41a1fc7d2509bf9785ac082