Back to Search
Start Over
Développement d'un module de génération de paraphrases pour la data augmentation
- Source :
- Sciences de l'Homme et Société. 2019
- Publication Year :
- 2019
- Publisher :
- HAL CCSD, 2019.
-
Abstract
- This paper summarizes the work completed during a six-month internship in the Research & Development team of Linagora. The aim of this project is to develop a paraphrasing tool able to expand the training datasets of the smart vocal assistant LinTO. We started by analyzing the existing commands in the original corpus : the recurrent syntactic structures and the paraphrasing mecanisms that can be applied to them. From these observations, we created a rule-based grammar to generate semantically and synctactically correct sentences.; Ce document résume 6 mois de travail au sein de l’équipe Recherche et Développement de Linagora Toulouse. Le but de ce projet était de développer un module de paraphrase permettant d’enrichir le corpus d’apprentissage de l’agent conversationnel LinTO. Nous avons commencé par analyser les différentes commandes présentes dans notre corpus initial : les structures syntaxiques récurrentes et les mécanismes de paraphrasage qu’on peut leur appliquer. À partir de ces observations, nous avons créé une grammaire à base de règles pour générer plusieurs paraphrases d’une commande en entrée.
Details
- Language :
- French
- Database :
- OpenAIRE
- Journal :
- Sciences de l'Homme et Société. 2019
- Accession number :
- edsair.od......2592..800669a2f8a4c2abf6584ce811e99fb8