Back to Search Start Over

Développement d'un module de génération de paraphrases pour la data augmentation

Authors :
Ratsiandavana, Sonia
Université Grenoble Alpes - UFR Langage, lettres et arts du spectacle, information et communication - Dpt Sciences du langage et français langue étrangère (UGA UFR LLASIC SLFLE)
Université Grenoble Alpes [2016-2019] (UGA [2016-2019])
Linagora Grand Sud Ouest, 75 route de Revel, 31400 Toulouse
Zied Sellami
Olivier Kraif
Source :
Sciences de l'Homme et Société. 2019
Publication Year :
2019
Publisher :
HAL CCSD, 2019.

Abstract

This paper summarizes the work completed during a six-month internship in the Research & Development team of Linagora. The aim of this project is to develop a paraphrasing tool able to expand the training datasets of the smart vocal assistant LinTO. We started by analyzing the existing commands in the original corpus : the recurrent syntactic structures and the paraphrasing mecanisms that can be applied to them. From these observations, we created a rule-based grammar to generate semantically and synctactically correct sentences.; Ce document résume 6 mois de travail au sein de l’équipe Recherche et Développement de Linagora Toulouse. Le but de ce projet était de développer un module de paraphrase permettant d’enrichir le corpus d’apprentissage de l’agent conversationnel LinTO. Nous avons commencé par analyser les différentes commandes présentes dans notre corpus initial : les structures syntaxiques récurrentes et les mécanismes de paraphrasage qu’on peut leur appliquer. À partir de ces observations, nous avons créé une grammaire à base de règles pour générer plusieurs paraphrases d’une commande en entrée.

Details

Language :
French
Database :
OpenAIRE
Journal :
Sciences de l'Homme et Société. 2019
Accession number :
edsair.od......2592..800669a2f8a4c2abf6584ce811e99fb8