Back to Search Start Over

Vers une lexicographie mandingue sur la base de grands corpus annotés

Authors :
Vydrin, Valentin
Langage, LAngues et Cultures d'Afrique (LLACAN)
Institut National des Langues et Civilisations Orientales (Inalco)-Centre National de la Recherche Scientifique (CNRS)
ANR-11-IDEX-0005,USPC,Université Sorbonne Paris Cité(2011)
Source :
Mandenkan : Bulletin Semestriel d'Études Linguistiques Mandé, Mandenkan : Bulletin Semestriel d'Études Linguistiques Mandé, Presses de l'Inalco, 2020, pp.89-110. ⟨10.4000/mandenkan.2281⟩
Publication Year :
2020
Publisher :
HAL CCSD, 2020.

Abstract

International audience; Availability of big electronic annotated corpora for Maninka and Bamana languages lets us think about development of corpus-driven dictionaries, i.e. dictionaries of a new generation. In a corpus-driven dictionary, elaboration of the polysemy, collocations, syntactic valencies, stylistic, regional and dialectal characteristics of each lexeme (and of each sense of a lexeme) will be based on the analysis of a concordance extracted from the corpus. Henceforth, it becomes possible to evaluate statistically each feature. Two sample examples of lexicographic analysis of Bambara lexemes, bánban and jàhadi, are given.; La disponibilité des corpus électroniques annotés comptant des millions de mots pour les langues maninka et bambara permet de penser des dictionnaires de nouvelle génération. Dans un tel dictionnaire, l'élaboration de la polysémie, combinabilité, valences syntaxiques, caractéristiques stylistiques, régionales et dialectales pour chaque lexème (et pour chaque sens du lexème) sera basée sur l'analyse du concordancier dérivé du corpus. Désormais, il devient possible d'évaluer statistiquement chaque trait caractéristique du lexème. Une analyse lexicographique, sur la base des concordanciers, est présenté sur l'exemple des lexèmes bambara bánban et jàhadi.; Создание миллионных электронных аннотированных корпусов для языков манинка и бамана ставит вопрос о разработке «корпусных словарей», т.е. словарей нового поколения. В таком словаре разработка полисемии, сочетаемости, синтаксических валентностей, стилистических и регионально-диалектных характеристик каждой лексемы (и каждого значения лексемы) должно базироваться на анализе корпусного конкорданса. Становится возможным не только выявление различных характеристик, но и их статистическая оценка. В статье даётся, в качестве примера, лексикографический анализ баманских лексем bánban и jàhadi на основе корпусных данных.

Details

Language :
French
ISSN :
07525443 and 2104371X
Database :
OpenAIRE
Journal :
Mandenkan : Bulletin Semestriel d'Études Linguistiques Mandé, Mandenkan : Bulletin Semestriel d'Études Linguistiques Mandé, Presses de l'Inalco, 2020, pp.89-110. ⟨10.4000/mandenkan.2281⟩
Accession number :
edsair.dedup.wf.001..3c766819fa281db336dd4fd6c84dcd47
Full Text :
https://doi.org/10.4000/mandenkan.2281⟩