Back to Search Start Over

Building a syntactic-semantic interface for a semi-automatically generated TAG for Arabic

Authors :
Ben Khelil, Chérifa
Zribi, Chiraz
Duchier, Denys
Parmentier, Yannick
Laboratoire RIADI-GDL [Manouba]
Ecole Nationale des Sciences de l'Informatique, Manouba, Tunisie
Laboratoire d'Informatique Fondamentale d'Orléans ( LIFO )
Université d'Orléans ( UO ) -Institut National des Sciences Appliquées - Centre Val de Loire ( INSA CVL )
Institut National des Sciences Appliquées ( INSA ) -Institut National des Sciences Appliquées ( INSA )
Natural Language Processing : representations, inference and semantics ( SYNALP )
Department of Natural Language Processing & Knowledge Discovery ( LORIA - NLPKD )
Laboratoire Lorrain de Recherche en Informatique et ses Applications ( LORIA )
Institut National de Recherche en Informatique et en Automatique ( Inria ) -Université de Lorraine ( UL ) -Centre National de la Recherche Scientifique ( CNRS ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -Université de Lorraine ( UL ) -Centre National de la Recherche Scientifique ( CNRS ) -Laboratoire Lorrain de Recherche en Informatique et ses Applications ( LORIA )
Institut National de Recherche en Informatique et en Automatique ( Inria ) -Université de Lorraine ( UL ) -Centre National de la Recherche Scientifique ( CNRS ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -Université de Lorraine ( UL ) -Centre National de la Recherche Scientifique ( CNRS )
Laboratoire de recherche en Génie Logiciel, Applications distribuées, Systèmes décisionnels et Imagerie intelligente [Manouba] (RIADI)
École Nationale des Sciences de l'Informatique [Manouba] (ENSI)
Université de la Manouba [Tunisie] (UMA)-Université de la Manouba [Tunisie] (UMA)
Laboratoire d'Informatique Fondamentale d'Orléans (LIFO)
Université d'Orléans (UO)-Institut National des Sciences Appliquées - Centre Val de Loire (INSA CVL)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)
Natural Language Processing : representations, inference and semantics (SYNALP)
Department of Natural Language Processing & Knowledge Discovery (LORIA - NLPKD)
Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)
Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)
Source :
The International Arab Journal of Information Technology, The International Arab Journal of Information Technology, In press, 〈http://www.iajit.org/〉, International Arab Journal of Information Technology, International Arab Journal of Information Technology, Colleges of Computing and Information Society (CCIS), In press, The international Arab journal of information technology, The international Arab journal of information technology, 2018, 15 (3A), pp.540-549
Publication Year :
2018
Publisher :
HAL CCSD, 2018.

Abstract

Extended version of a paper presented at ACIT 2017. Full text available at https://iajit.org/portal/PDF/Special%20Issue%202018,%20No.%203A/17414.pdf; International audience; Syntactic and semantic resources play an important role for various Natural Language Processing (NLP) tasks by providing information about the correct structural representations of the sentences and their meaning. To date, there is not a wide-coverage electronic grammar for the Arabic language. In this context, we present a new approach for building a tree adjoining grammar to represent the syntax and the semantic of modern standard Arabic. This grammar is produced semi-automatically with the XMG (eXtensible MetaGrammar) description language. First the syntax of Arabic is described using the defined Arab-XMG meta-grammar. Then semantic information is added by introducing semantic frame-based dimension into the meta-grammar. This is achieved by exploiting lexical resources such as Arabic VerbNet. Finally, the link between semantic and syntax is established using a syntax-semantic interface that allows the construction of sentence meaning through semantic role labeling. Experiments were performed to check grammar coverage as well as the syntactic-semantic analysis. The results showed that the generated grammar can cover the basic syntactic structures of Arabic sentences and the different phrasal structures with a precision rate of about 92%. Moreover, it confirms the effectiveness of the proposed approach as we were able to parse semantically a set of sentences and build their semantic representations with a precision rate of about 72%.

Details

Language :
English
ISSN :
16833198 and 23094524
Database :
OpenAIRE
Journal :
The International Arab Journal of Information Technology, The International Arab Journal of Information Technology, In press, 〈http://www.iajit.org/〉, International Arab Journal of Information Technology, International Arab Journal of Information Technology, Colleges of Computing and Information Society (CCIS), In press, The international Arab journal of information technology, The international Arab journal of information technology, 2018, 15 (3A), pp.540-549
Accession number :
edsair.dedup.wf.001..5602ebe6f4d07201c27bf54a05720ff1