12 results on '"Linguistique de corpus"'
Search Results
2. Ser / estar soltero, deux manières d’exprimer le célibat en espagnol ?
- Author
-
Valdez, Cristian and Valdez, Cristian
- Subjects
Ser and estar ,Corpus linguistics ,Linguistique de corpus ,Synonymie discursive ,[SCCO.LING] Cognitive science/Linguistics ,Ancrage spatio-temporel ,Catégorisation ,Categorisation ,Spatio-temporal anchoring ,Discursive synonymy ,Ser et estar - Abstract
Cet article évalue le degré de recouvrement sémantique entre ser soltero et estar soltero par une analyse de données fondée, d’une part, sur l’identification des marques textuelles se rapportant aux opérations de catégorisation et d’ancrage spatio-temporel et, d’autre part, sur la possibilité de commutation entre les constructions. Cette méthodologie permet de distinguer les contextes où l’opposition sémantique est fonctionnelle des cas où elle n’est pas nécessairement activée., This article evaluates the degree of semantic overlap between ser soltero and estar soltero through a data analysis based, on the one hand, on the identification of textual markers related to categorization and spatio-temporal anchoring operations and, on the other, on the possibility of substitution between the constructions. Thanks to this methodology, contexts where the semantic opposition is functional can be distinguished from cases where it is not necessarily activated.
- Published
- 2022
- Full Text
- View/download PDF
3. Occasional word formations in written and spoken German
- Author
-
Stumpf, Sören
- Subjects
Corpus linguistics ,Formation de mots ,Spoken German ,Allemand parlé ,Linguistique de corpus ,Occasionalism ,Allemand écrit ,Written German ,Occasionnalisme ,Word formation - Abstract
Cet article offre un aperçu de la formation lexicale en allemand courant et plus particulièrement des occasionnalismes dans des types de textes écrits et oraux. Après avoir défini les termes formation lexicale usuelle, occasionnalisme et néologisme, nous présenterons notre approche méthodologique et montrerons comment les occasionnalismes se répartissent entre les types de textes relevant d’une conception orale et ceux relevant d’une conception écrite., This paper gives a general overview of word formation in current German and more particularly of occasional word formations in written and spoken text types. First, the terms usual word formation, occasional word formation and neologism will be defined and distinguished from each other, then the methodological approach will be justified and the distribution of occasional word formation between orality and literacy will be demonstrated.
- Published
- 2021
- Full Text
- View/download PDF
4. Cohérence de l’alphabet meigretiste
- Author
-
Hsueh, Chia-Hung
- Subjects
Renaissance ,Typème ,Grammatologie ,Linguistique de corpus ,Philologie numérique ,Histoire de l’orthographe française ,Humanisme ,Histoire des théories linguistiques à la Renaissance française - Abstract
Cet article expose un parcours, le nôtre, dans lequel nous affrontons les problèmes soulevés par l’établissement de l’alphabet de Meigret ainsi que par la numérisation des ouvrages scripturaux du grammairien. La cohérence de cet alphabet et de son écriture est donc non seulement un constat à montrer, mais surtout un ensemble de dispositifs méthodologiques et technologiques à monter. Dans quelle mesure le système scriptural est-il développé dans une cohérence ?, This article outlines a path, our own, in which we confront the problems raised by the establishment of Meigret’s alphabet and the digitization of the grammarian’s scriptural works. The coherence of this alphabet and its writing is thus not only a statement to be shown, but above all a set of methodological and technological devices to be set up. To what extent is the scriptural system coherently developed ?
- Published
- 2020
- Full Text
- View/download PDF
5. Cahiers de lexicologie. 2019 – 1, n° 114
- Subjects
Préfabrication ,Phraséologie ,Phrasème ,Phrase figée ,Dictionnaire ,Linguistique de corpus ,Phrase ,Routine conversationnelle ,Figement - Abstract
Contributeurs : Jean-Claude Anscombre, Guillaume Ciry, Cristian Diaz Rodriguez, Gaétane Dostie, Antoine Gautier, Sonia Gómez-Jordana, Alicja Kacprzak, Maurice Kauffer, Denis Le Pesant, Marie Reetz, Laurence Rouanne, Agnès Tutin et Jean-Louis Vaxelaire.
- Published
- 2019
- Full Text
- View/download PDF
6. Suggestions méthodologiques et outils de traitement de corpus pour l’étude des Phrases Préfabriquées des Interactions
- Author
-
Le Pesant, Denis
- Subjects
Corpus linguistics ,Phraséologie ,Phrasème ,Electronic dictionary ,Pragmatics ,Phraseology ,Phraseme ,Linguistique de corpus ,Dictionnaire électronique ,Pragmatique - Abstract
Cet article concerne trois des quatre catégories de phrasèmes qu’Agnès Tutin (dans ce numéro) appelle Phrases Préfabriquées des Interactions (PPI), telles les expressions on aura tout vu, ça va pas la tête. Après avoir mesuré le défi considérable que représentent les PPI métalinguistiques, réactives et situationnelles pour l’analyse linguistique, Denis Le Pesant présente son propre dictionnaire en ligne des PPI, accompagné d’outils de linguistique de corpus., This paper deals with three of the four categories of phrasemes called by Agnès Tutin (in this journal issue) Phrases Préfabriquées des Interactions (PPI), such as on aura tout vu, ça va pas la tête. Having examined the challenges posed by the metalinguistic, reactive and situational PPI in terms of linguistic research, Denis Le Pesant presents his own online Dictionary of the PPI, together with some tools for the processing of large corpora.
- Published
- 2019
- Full Text
- View/download PDF
7. Exploration textométrique d’un corpus comparable bilingue
- Author
-
Marion Bendinelli, Edition, Littératures, Langages, Informatique, Arts, Didactique, Discours - UFC (UR 4661) (ELLIADD), Université de Franche-Comté (UFC), and Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université Bourgogne Franche-Comté [COMUE] (UBFC)
- Subjects
Linguistique systémique fonctionnelle ,Logiciel TXM ,Translation ,Corpus linguistics ,Cooccurrence ,Traduction ,Systemic Functional Linguistics (SFL) ,TXM software ,Linguistique de corpus ,Textométrie ,Textometrics ,ComputingMilieux_MISCELLANEOUS ,[SHS]Humanities and Social Sciences - Abstract
L’étude vise à repérer automatiquement des usages langagiers équivalents dans un corpus comparable bilingue anglais-français de linguistique systémique fonctionnelle. Le travail porte sur la recherche de traduction(s) pour la notion delicacy. L’exploration du corpus se fonde sur la méthode textométrique et les logiciels TXM et Hyperbase. Sont envisagées fréquences d’emploi et réseaux de cooccurrents de delicacy et de ses traductions ; la comparabilité des volets est également discutée., The paper studies the meaning and uses of delicacy in a multilingual comparable corpus gathering papers in systemic functional linguistics. It aims at automatically identifying lexico-semantic means that could be considered as translational equivalences of delicacy in French. The textometric approach and the softwares TXM and Hyperbase are used to explore the corpus, going through frequency lists and networks of cooccurrences. The comparability of the English and French sub-corpora is discussed.
- Published
- 2019
- Full Text
- View/download PDF
8. Déverbaux en français, lexicographie et corpus
- Author
-
Jacquey, Evelyne
- Subjects
Lexicography ,Corpus linguistics ,Lexicographie ,Sémantique lexicale ,Linguistique de corpus ,Deverbal nouns ,Noms déverbaux ,Lexical semantics - Abstract
Cet article est avant tout méthodologique. Il s'intéresse à une question largement étudiée, le contenu sémantique des noms déverbaux en français entre une lecture événementielle (activité, accomplissement ou achèvement au sens de Vendler (1967)) et une lecture résultative (état ou entité). Il développe quelques pistes pour qualifier les différentes acceptions possibles de ces noms en articulant plusieurs disciplines (morphologie, sémantique, lexicographie et lexicologie) et deux méthodologies d'étude (linguistique introspective et linguistique de corpus)., This article explains a methodology. The main issue is very well-known: the lexical ambiguity of deverbal nouns in French one reading at least of which refers to an event: activity, accomplishment, achievement in the terminology of Vendler 1967 to which we add states. To describe the various readings of the deverbal nouns under study, the article draws at least partly on four main disciplines, Morphology, Semantics, Lexicography and Lexicology, and two main methdologies in Linguistics, traditional Linguistics, which makes use of constructed examples, and Corpus Linguistics, which makes use of attested examples.
- Published
- 2013
- Full Text
- View/download PDF
9. Terminology and computational linguistics: new praxes in terminography
- Author
-
Barcellos Almeida, Gladis Maria De and Mendonça De Oliveira, Leandro Henrique
- Subjects
Atividade terminográfica ,Corpus linguistics ,Definição terminológica ,Computer linguistics ,Ontology ,Linguística computacional ,Term management ,Linguistique de corpus ,Activité terminographique, ontologies ,Terminological definition linguística de corpus ,Ontologias ,Définition terminologique ,Linguistique informatisée - Abstract
Les activités terminographiques qui se sont développées au Brésil ont très fortement bénéficié des avancées obtenues en Linguistique Informatisée et Linguistique de Corpus, ainsi que du développement des outils informatiques pour le traitement du portugais. Dans ce contexte, la terminologie descriptive à base linguistique connaît un essor remarquable dans le pays, grâce à la possibilité de travailler avec des grands corpus permettant l’observation et la description systématique des phénomènes linguistiques récurrents, ce qui était impossible auparavant. Pour donner des exemples des nouvelles pratiques terminographiques en cours au Brésil, nous avons choisi le travail développé par le Groupe d’études et de recherches en terminologie de l’UFSC (GETerm), qui développe des produits terminologiques depuis 1999. Ainsi, nous présentons la méthodologie de travail couvrant les différentes étapes de l’activité terminographique du GETerm, focalisant notre attention sur l’environnement informatique dénommé e-Termos, développé par les chercheurs de ce groupe. Cet environnement rassemble une panoplie d’outils linguistiques interactifs dans une structure modulaire vouée aux activités terminographiques telles que la gestion des corpus, l’extraction semi-automatique des termes, l’élaboration et l’éditon de fiches terminologiques, le dessin de l’architecture et l’organisation des cartes conceptuelles (les ontologies), la rédaction de la définition terminologique, l’édition et la diffusion des articles., Term management in Brazil has been greatly facilitated over the past fifteen years thanks to progress made in computer and corpus linguistics, in particular the development of IT tools for processing Portuguese. This environment has contributed to the remarkable development of descriptive terminology based on actual linguistic description, exploiting the new possibilities previously unattainable opened up by access to large-scale corpora which enable the linguist to observe and describe recurrent linguistic phenomena systematically. To exemplify the new term management practices being developed in Brazil today, this article presents the current program of the Group for studies and research in terminology of the Federal University of São Carlos (GETerm), which has been developing computer-based tools since 1999. The methodology of the work corresponding to the various stages in terminology management is presented, focusing on the IT environment known as e-Termos, developed in-house. This environment brings together a set of collaborative linguistic tools linked to a modular structure dedicated to terminological activities such as corpus management, semi-automatic term extraction, preparing and publishing term records, drawing the architecture and organisation of conceptual charts (ontologies), writing definitions of terms, publishing and disseminating articles. Há mais ou menos uma década, observa-se a direta interferência, nas atividades terminográficas desenvolvidas no Brasil, dos avanços em Linguística Computacional, Linguística de Corpus e o desenvolvimento de ferramentas computacionais voltadas para o processamento do português. Nesse sentido, a terminologia descritiva de base linguística passa a ter um amplo desenvolvimento, já que a possibilidade de lidar com grandes corpora permite a observação e descrição de fenômenos linguísticos recorrentes antes impossível de perceber. Para tratar das novas práticas em terminografia, elegeu-se como cenário o Grupo de Estudos e Pesquisas em Terminologia (GETerm) que, desde 1999, desenvolve produtos terminológicos. Assim, pretende-se apresentar a metodologia de trabalho envolvida nas diversas fases da atividade terminográfica, dando relevo ao ambiente computacional denominado e-Termos, elaborado por nossa equipe de pesquisa, o qual reúne um conjunto de ferramentas linguísticas e colaborativas interligadas a uma estrutura modular dedicada às atividades terminográficas, tais como gerenciamento de corpora, extração semiautomática de termos, elaboração e edição de fichas terminológicas, arquitetura e preenchimento de mapas conceituais (ontologias), redação da definição terminológica, edição e difusão de verbetes.
- Published
- 2012
- Full Text
- View/download PDF
10. Corpus-driven terminology in Brazil
- Author
-
Tagnin, Stella O.
- Subjects
Extended unit of meaning ,Collocates ,Fraseologismo ,Glossaire technique ,Corpus-driven terminology ,Candidato termo ,Phraséologisme ,Candidate terms ,Colocação ,Technical English-Portuguese glossaries linguística de corpus ,Linguistique de corpus ,Collocation ,Glossário técnico ,Candidat terme - Abstract
Au Brésil, la plupart des ouvrages terminologiques de référence tendent à ne présenter que des termes monolexicaux, ce qui se révèle finalement de peu d’utilité pour les traducteurs et les rédacteurs de textes, car le langage est en grande partie constitué de « blocs préfabriqués ». Le plus souvent, ces travaux ne sont que l’actualisation d’ouvrages antérieurs, mis à jour sans aucun critère scientifique, réalisés suivant l’intuition de l’auteur de la compilation. En revanche notre groupe de recherche, le projet COMET, produit des glossaires, à partir d’un corpus, approche qui privilégie non seulement les termes les plus fréquents dans le domaine, mais qui inclut également les collocations et les phraséologismes importants. Un corpus spécialisé, élaboré très méticuleusement et surtout composé d’un corpus équivalent en anglais et en portugais, avec des textes originaux dans les deux langues dans lequel toutes les entrées sont extraites. Ce processus est réalisé grâce au programme WordSmith Tools, outil informatique pour l’analyse linguistique. La première démarche consiste à extraire une liste de fréquence de l’un des corpora ; cette liste est ensuite comparée avec l’autre liste de fréquence, généralement à partir d’un corpus de langue générale. On obtient une liste de mots-clés considérés candidats termes. Chacun est alors analysé dans des lignes de concordance également produites par le programme, pour identifier ses collocations, le contexte d’occurrence, ou pour vérifier s’il fait partie d’une unité étendue de signifié. Ce procédé est alors appliqué dans l’autre langue. Les équivalents sont identifiés grâce à des stratégies de recherche spécifique. Cette méthodologie a été utilisée pour l’élaboration de plusieurs glossaires techniques dont deux sont publiés : Glossaire de la chimie (Perrotti- Garcia et Rebechi 2007) et Glossaire culinaire (Teixeira et Tagnin 2008). Celui de la photographie est sous presse et deux autres, sur la mode et le football, sont en cours de révision et seront publiés sous peu., Most terminological reference sources in Brazil tend to focus primarily on single terms, which eventually proves to be of little use to translators and other text producers because language consists mostly of pre-fabricated chunks. Besides, quite often these works merely update previous ones without any scientific criteria for this addition, except for the compiler’s intuition. In contrast, our research group, Project CoMET, has been producing corpus-driven glossaries which not only consist of the most frequent vocabulary in the area, but also includes collocations and other relevant phraseology. A carefully built specialized corpus, mostly comparable English-Portuguese, with original texts in both languages, is the source from which all entries are extracted. This is done with WordSmith Tools, a computational tool for linguistic analysis. First, a frequency list of one of the corpora is extracted. Next, this list is compared with another frequency list, usually from a corpus of general language. This produces a list of KeyWords, which are considered candidate terms. Each one is then analyzed in concordance lines to identify its collocates, context of occurrence, or to verify if it is part of an extended unit of meaning. This process is then repeated for the other language. Equivalents are then retrieved with specific search strategies. This methodology has been used for the production of two technical English-Portuguese glossaries: Chemistry (Perrotti-Garcia & Rebechi 2007) and Cooking (Teixeira & Tagnin 2008). Three other ones, Fashion, Photography and Football, are being revised to be published shortly. A maioria das fontes de referência terminológicas no Brasil tendem a apresentar principalmente termos monolexicais, o que acaba por se revelar ser de pouca utilidade para tradutores e produtores de texto, porque a linguagem é, em grande parte, constituída de blocos pré-fabricados. Além disso, muitas vezes esses trabalhos limitam-se a atualizar alguma obra anterior, sem quaisquer critérios científicos para esse acréscimo, exceto a intuição do compilador. Em contraste, nosso grupo de pesquisa, projeto COMET, vem produzindo glossários direcionados por um corpus, uma abordagem que privilegia não apenas os termos mais frequentes na área, como também inclui colocações e fraseologismos relevantes. Um corpus especializado cuidadosamente construído, em especial um corpus comparável inglês-português, com textos originais em ambas as línguas, é a fonte da qual todas as entradas são extraídas. Esse processo é realizado com o programa WordSmith Tools, uma ferramenta computacional para análise linguística. O primeiro passo consiste em extrair uma lista de frequência de um dos corpora. Em seguida, essa lista é comparada com outra lista de frequência, comumente a partir de um corpus de língua geral. Isso produz uma lista de palavras-chave, que são consideradas candidatas a termos. Cada uma é então analisada em linhas de concordância, também produzidas pelo programa, para identificar suas colocações, o contexto de ocorrência, ou para verificar se é parte de uma unidade estendida de significado. Esse processo é então repetido para o outro idioma. Equivalentes são identificados com estratégias de busca específicas. Esta metodologia tem sido utilizada para a produção de vários glossários técnicos inglês-português, dois dos quais já publicados: Química (Perrotti-Garcia & Rebechi 2007) e Culinária (Teixeira & Tagnin 2008). O de Fotografia está no prelo e outros dois, de Moda e de Futebol, estão sendo revistos para serem publicados em breve.
- Published
- 2012
- Full Text
- View/download PDF
11. Propositions pour la détection automatique de la néologie sémantique
- Author
-
Reutenauer, Coralie
- Subjects
Sémantique textuelle ,Corpus linguistics ,Domaines ,Textual statistics ,Semantic tagging ,Semantic neology ,Sémème ,Text-based semantics, meaning representation ,Traitement automatique ,Annotation sémantique ,Domains ,Linguistique de corpus ,Textométrie ,Néologie - Abstract
Alors que la néologie formelle fait aujourd’hui l’objet de traitements informatiques, une approche automatisée de la néologie sémantique reste délicate. Des travaux en sémantique textuelle (Rastier et Valette 2009) proposent des représentations des mécanismes sémiques en jeu dans la néologie sémantique de façon à la fois détaillée et ancrée dans la pratique. Cet article présente un travail prospectif sur l’identification de la néologie sémantique à partir de méthodes statistiques sur corpus et dans la lignée de la sémantique textuelle, notamment à travers le rôle clé accordé à la notion de sème. Dans ce cadre a été élaborée une procédure informatisée, fondée sur une annotation de corpus en traits sémantiques et destinée à mettre en évidence des néologismes sémantiques. Cette procédure est appliquée à un cas d’étude, l’adjectif toxique dans le contexte de la crise économique et financière de fin 2008 à début 2009., Various techniques have been developed and implemented to process neology of form automatically, but the processing of semantic neology is still a tricky question. Mechanisms underlying semantic neology are described using semantic features or semes in works on text semantics (Rastier and Valette 2009). In this paper, we propose a prospective approach to detect semantic neology using statistical methods and corpus analysis. These methods are inspired from text semantics, since they use descriptors considered as semes. We propose a process relying on semantic tagging to detect semantic neologisms. This process is applied to study the French adjective toxique in the context of the economic crisis in 2008 and 2009.
- Published
- 2012
- Full Text
- View/download PDF
12. Neologica. 2012, n° 6
- Subjects
Siglaison ,Traduction ,Perte de domaine ,Extraction de néologismes ,Dépendance terminologique ,Linguistique de corpus ,Vocabulaire d'auteur ,Formation terminologique secondaire - Abstract
NÉOLOGIE ET TRADUCTION SPÉCIALISÉE ◊ Antoinette Renouf, « Defining neology to meet the needs of the translator: a corpus-based perspective » - Marita Kristiansen et Gisle Andersen, « Corpus approaches to neology and their relevance for dynamic domains » - M. Teresa Cabré et Rogelio Nazar, « Towards a new approach to the study of neology » - Pascaline Dury,« Le sentiment d'un besoin néologique chez l'expert pour remplacer un terme à connotation péjorative : quelques exemples tirés du domaine médical » - Joaquín García Palacios et Lara Sanz Vicente, « El papel de la traducción en la formación secundaria de términos sintagmáticos » - Ana María Gentile, « Néologie d'origine, néologie de transfert : le cas des néologismes dans le domaine de la psychanalyse et leur traduction en espagnol » - Jean Quirion, « Néologie traductive, néologie aménagiste et néologie collaborative massive : l'unité dans la disparité » - Reuben Seychell, « Neologising - a case study on Maltese » - Nathalie Lemaire et Paul Muraille, « Sigles graphiques en langue de spécialité : typologie, variabilité, enjeux » ◊ VARIA ◊ Charlotte Coy, « Les recommandations officielles des Commissions de Terminologie et leur rapport à la langue commune : indices pour un profil lexicologique du français » - Pascaline Faure, « Maux et mots ou la dénomination des maladies : étude comparative anglais/français »
- Published
- 2012
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.