Back to Search Start Over

Les apports du traitement automatique des langues à la lisibilité du français langue étrangère

Authors :
François, Thomas
UCL - LALE - Langues et lettres
UCL - SSH/TALN - Centre de traitement automatique du langage
UCL - SSH/ILC - Institut Langage et Communication
Fairon, Cédrick
Simon, Anne-Catherine
Bouillon, Henry
Antoniadis, Georges
Degand, Liesbeth
Desmet, Piet
Saerens, Marco
Publication Year :
2011

Abstract

This thesis offers a critical analysis of the methodological means to be used to implement a readability formula specific to the context of French as a foreign language (FFL). A readability formula is a tool that allows to assess automatically the reading complexity of a text, using a set of linguistic features such as syntactic complexity, lexical load, etc.. After summarizing the current views on the way a FFL learner understands a text, this study offers a review as complete as possible of the readability studies in French, but also English. This state-of-the-art is followed by an inventory of the linguistic features that may generate reading difficulties. These are mainly from the literature, but several of them are new, inspired by recent work in cognitive psychology of reading. In a second step, based on these methodological considerations and a corpus of texts taken from FFL textbooks, the ability of these linguistic features to adequately predict the difficulty of texts for FFL is evaluated using 406 variables. This work ends with the development of a new readability formula for FFL, that uses technologies from natural language processing. Cette thèse propose une réflexion critique sur les moyens méthodologiques à mettre en oeuvre pour concevoir une formule de lisibilité spécifique à la lecture en français langue étrangère (FLE). Une formule de lisibilité est un outil permettant d'évaluer automatiquement la complexité d'un texte à la lecture à partir d'un ensemble de caractéristiques linguistiques des textes, telles que la complexité syntaxique, la charge lexicale, etc. Après avoir résumé les positions actuelles sur la manière dont un apprenant de FLE appréhende un texte, cette étude propose un panorama aussi complet que possible des études en lisibilité du français, mais aussi de l'anglais. Cet état de l'art est suivi d'un inventaire des caractéristiques linguistiques susceptibles de poser des difficultés à la lecture. Celles-ci sont principalement tirées de la littérature, mais on y compte plusieurs nouvelles dimensions, inspirés des travaux récents en psychologie cognitive de la lecture. Dans un second temps, s'appuyant sur ces réflexions méthodologiques et sur un corpus de textes extraits de manuels de FLE, la capacité de ces caractéristiques linguistiques à prédire adéquatement la difficulté de textes pour le FLE est évaluée à l'aide de 406 variables. Ce travail se termine par le développement d'une nouvelle formule de lisibilité pour le FLE, qui repose sur des technologies de traitement automatique des langues. (LING 3) -- UCL, 2011

Details

Language :
French
Database :
OpenAIRE
Accession number :
edsair.od......1493..d94fe05e07b5a9ceee4178d5a815a9ee