29 results on '"Philologie numérique"'
Search Results
2. Un corpus pour la Sémantique interprétative
- Author
-
Pincemin, Bénédicte, Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA), Universidade Federal da Paraíba Brasil, Université Lumière Lyon 2, Université de Rouen, Institut National de Langues Orientales, Université de Moncton, Institut Ferdinand de Saussure, and Collectif La Reconstruction
- Subjects
[SHS.STAT]Humanities and Social Sciences/Methods and statistics ,Text Encoding Initiative TEI ,Analyse qualitative ,Analyse statistique des données textuelles ADT ,Sémantique interprétative ,Science ouverte ,Logiciel TXM ,Analyse quantitative ,Herméneutique numérique ,François Rastier ,Corpus numérique ,Philologie numérique ,Textométrie ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,Humanités numériques - Abstract
Session Axe 2 « Corpus, texte et méthodes » du 5 octobre 2022, coordonnée par Mathieu Valette.; International audience; Le projet Sittelle, initié en 2021 à l'occasion de la préparation des 35 ans de la Sémantique interprétative, construit progressivement un corpus des écrits de sémantique interprétative de François Rastier et propose de le parcourir avec des outils textométriques. Sa motivation est pédagogique (éclairer la compréhension par d'autres parcours de lecture), épistémologique (approfondir ou compléter la description de la pensée rastiérienne par des observations méthodiques) et linguistique (expérimenter une modélisation de structures textuelles et intertextuelles, approcher le fonctionnement des isotopies). Son mode d'organisation opte pour la science ouverte.Le contexte de cette session, questionnant la construction et l'exploitation des corpus numériques, est l'occasion de partager quelques questions rencontrées ou attendues dans la mise en oeuvre initiale de ce corpus d'écrits de Sémantique interprétative.
- Published
- 2022
3. Approche quantitative des marques graphiques et lexicales de l’oral représenté à travers les corpus BFM et BVH
- Author
-
Lavrentiev, Alexei and Lavrentiev, Alexei
- Abstract
This paper presents an experience of using digital text corpora, Base de français médiéval and Bibliothèques virtuelles humanistes, in a research on graphical and lexical markers of represented spoken utterances and citations of written sources. Depending on editing practices and on the state of markup, different queries may be applied to the whole corpora or to some parts of them. The indicators examined in the paper include the relative frequency of the verb dire (‘to say’), the frequency of different punctuation marks used at the borders of the structural elements of represented speech, and marks of written sources citations, L’article présente une expérience d’exploitation de corpus numériques, la Base de français médiéval et les Bibliothèques virtuelles humanistes, pour l’étude de la signalisation graphique et lexicale de l’oral représenté et des citations. Selon les méthodes d’édition et l’état de balisage, différentes requêtes peuvent être appliquées à l’ensemble des corpus ou à leurs parties. Les indicateurs étudiés incluent la fréquence relative du verbe dire, la fréquence des différentes marques de ponctuation utilisées aux frontières des éléments qui constituent les épisodes d’oral représenté et les marques de citation de sources écrites., En este artículo, presentamos una experiencia de uso de corpus digitales –la Base de français médiéval y las Bibliothèques virtuelles humanistes – para el estudio de la señalización gráfica y léxica del oral representado y del discurso citado. Según los métodos de edición y el estado del marcado, se pueden aplicar diferentes búsquedas al conjunto de los corpus o a algunas de sus partes. Los indicadores estudiados incluyen la frecuencia relativa del verbo dire (‘decir’), la frecuencia de los diferentes signos de puntuación empleados en las fronteras entre elementos que constituyen episodios de oral representado y, por último, las marcas de cita de fuentes escritas
- Published
- 2021
4. La Base de français médiéval et le consortium CAHIER : dix ans d'échanges et de collaborations
- Author
-
Lavrentiev, Alexei, Guillot, Céline, Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA), Consortium CAHIER, École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA), and Lavrentev, Alexey
- Subjects
[SHS.LITT] Humanities and Social Sciences/Literature ,[SHS.LITT]Humanities and Social Sciences/Literature ,TXM ,[INFO]Computer Science [cs] ,[INFO] Computer Science [cs] ,Philologie numérique ,TEI ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics - Abstract
International audience; Le projet de la Base de français médiéval (BFM, http://txm.bfm-corpus.org) fait partie des membres fondateurs du Consortium CAHIER. Les origines du projet remontent à la fin des années 1980 et son évolution a suivi, et parfois anticipé, les grandes tendances du développement des humanités numériques. L'expérience de la BFM a permis de contribuer à plusieurs chantiers du consortium CAHIER : l'accès libre aux données, les normes d'encodage (et notamment l'usage de la TEI), la typologie textuelle, la mise en place de chaînes éditoriales ouvertes. Les échanges qui se sont produits dans les groupes de travail et lors des ateliers du consortium permettent à leur tour d'améliorer les pratiques d'encodage et les outils proposés aux utilisateurs de la BFM et d'assurer une plus grande interopérabilité et pérennité des données.La constitution de la BFM a commencé par la numérisation de l'édition de la Queste del saint Graal d'A. Pauphilet (1923) et la base a été enrichie au fil des ans grâce à des vacations, aux contributions de doctorants de Ch. Marchello-Nizia, aux échanges avec des collègues et, plus récemment, grâce à des financements ANR. A ce jour, la BFM comprend 170 textes composés entre le 9e et le 15e siècle, soit près de 4,7 millions de mots. Pour la Queste del saint Graal l'édition de Pauphilet a d'ailleurs été remplacée dans le corpus par une édition numérique originale (Marchello-Nizia et Lavrentiev 2019). Une augmentation importante du corpus est prévue en 2021. Les textes de la BFM sont étiquetés en morphosyntaxe et lemmatisés (avec ou sans vérification) et bénéficient du balisage XML-TEI enrichi. En particulier, le discours direct est balisé dans l'ensemble du corpus, ce qui permet de mener des recherches sur l'oral représenté (Guillot-Barbance et al. 2018). De nombreuses thèses et travaux de recherche ont été réalisés grâce aux données de la BFM. Notamment, la partie médiévale du corpus de la Grande grammaire historique du français (Marchello-Nizia et al. 2020) est entièrement issue de la Base de français médiéval. La BFM est accessible en ligne grâce au logiciel « portail TXM » (http://textometrie.org), les textes peuvent être consultés librement et l'accès au moteur de recherche et d'analyse est donné gratuitement sur simple inscription (Guillot-Barbance et al. 2017).Quand la TGIR Corpus (prédécesseur d'Huma-num) lance en 2010 l'appel à la création de consortiums de corpus, la BFM faisait déjà, depuis 2004, partie du Consortium international pour les corpus de français médiéval (CCFM, http://ccfm.ens-lyon.fr). Cette organisation informelle, n'ayant jamais bénéficié d'un financement spécifique et dont l'activité s'est estompée après 2008, a néanmoins permis d'entamer la réflexion et de publier des documents de travail sur les normes communes d'encodage et de description des textes, ainsi que sur les conditions d'accès aux corpus et d'échange de données. L'expérience du CCFM a sans doute inspiré l'initiative de la TGIR Corpus et a servi de point de départ pour certaines activités de CAHIER (notamment pour l'organisation de groupes de travail et pour la rédaction de guides de bonnes pratiques).L'un des premiers groupes de travail de CAHIER visait à traiter les questions juridiques liées aux droits d'auteurs (et d'éditeurs) et à la mise à disposition de corpus. La BFM avait commencé comme un ensemble de concordanciers échangés dans un cadre privé entre chercheurs sous la forme de CD-ROM ou de tirages papier, puis elle avait progressivement ouvert l'accès à l'interrogation et au téléchargement du corpus sur Internet. Elle avait une longue histoire de relations complexes avec les éditeurs commerciaux. Denise Pierrot, qui s'est occupée des questions juridiques pour la BFM, a également joué un rôle important dans le groupe de travail correspondant de CAHIER et a contribué à la rédaction du Guide des bonnes pratiques. La situation juridique a évolué suite aux décisions de justice dans le procès Droz contre Garnier numérique (2014 et 2017), ce qui a rendu possible la mise à disposition libre de textes historiques (hors apparat critique).La pérennisation des données, grâce notamment à l'usage de l'encodage XML-TEI pour les textes et les annotations, a été la priorité pour la BFM depuis le début des années 2000 (Guillot et Heiden 2002). Le consortium CAHIER a pu bénéficier de la documentation de la BFM relative à l'encodage TEI du corps du texte et de l'entête (teiHeader) des documents. La BFM a été l'un des premiers projets à se conformer au modèle élaboré pour l'outil Weboai de CAHIER permettant le moissonnage des métadonnées (http://weboai.cahier.huma-num.fr). Toujours dans le domaine des métadonnées, les descripteurs typologiques de BFM, tels que le genre ou le domaine du texte, ont servi de base au thésaurus élaboré par le groupe de travail « Typologie textuelle » de CAHIER. Ce thésaurus, très riche et soigneusement structuré, permettra à son tour de préciser les métadonnées des futurs corpus de la BFM et de faciliter l'analyse de données de corpus agrégés à partir de plusieurs sources.La pérennisation des données de recherche conformément aux principes FAIR (Findability, Accessibility, Interoperability and Reusability) est l'activité du Consortium CAHIER fortement encouragée par la TGIR Huma-Num. Même si la vision qui semble se dégager des recommandations du conseil scientifique d'Huma-Num et qui consiste à exiger avant tout le dépôt des données dans l'outil Nakala nous paraît un peu réductrice, il est certain que l'archivage pérenne et l'accessibilité des données sont extrêmement importants. Le soutien que CAHIER assure pour le dépôt des textes et des images dans NAKALA est très précieux pour la BFM.La formation aux outils d'édition, d'analyse et de publication de corpus ouverts, ainsi que l'échange de bonnes pratiques éditoriales, a toujours été l'une des principales activités de CAHIER. La BFM, qui se développe en étroite collaboration avec la plateforme de préparation, d'analyse et de préparation de corpus TXM (Heiden et al. 2010) a pu partager son expérience, et des membres de l'équipe BFM ont animé de nombreuses séances de formation lors des ateliers CAHIER.Le consortium CAHIER a également favorisé les échanges entre l'équipe TXM et le Pôle document numérique de la MSH de Caen qui développe la chaîne éditoriale Métopes (grâce notamment au financement d'un stage en 2017). La BFM bénéficie actuellement de certains éléments de Métopes pour la mise en page de ses éditions au format PDF et des scripts de traitement automatique permettant d'importer dans TXM des documents XML-TEI créés avec Métopes ont été élaborés.La BFM est un projet qui a commencé bien avant la création du Consortium CAHIER et qui va sans doute continuer à se développer après la disparition de CAHIER dans sa forme actuelle de consortium de la TGIR Huma-Num. Quel que soit l'avenir du Consortium, nous sommes convaincus que les ressources numériques, les méthodes et les outils de travail élaborés grâce ou avec le soutien de CAHIER ainsi que les relations humaines et les partenariats de recherche qui se sont tissés au cours des dix ans de ses activités continueront à jouer un rôle important dans la communauté des humanités numériques.
- Published
- 2021
5. Enjeux philologiques, linguistiques et informatiques de la philologie numérique : l’exemple de la segmentation des mots
- Author
-
Lavrentiev, Alexei, Guillot, Céline, Heiden, Serge, Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA), Lavrentev, Alexey, École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), and Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA)
- Subjects
Philologie numérique ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,Segmentation lexicale ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,Diachronie du français - Abstract
International audience; Les linguistes travaillant sur l’histoire de la langue ont toujours exploité et utilisé comme principale source d’exploration les éditions « classiques », bien que depuis longtemps on connaisse leurs limites pour la recherche linguistique. Le développement des technologies modernes a d’un autre côté rendu le recours à de nouveaux outils (concordances, index, calculs statistiques) peu à peu indispensable à la recherche en langue, et plus récemment, les progrès continus de la technologie ont également permis d’envisager la réalisation d’éditions d’un nouveau type. L’édition numérique, qui a déjà donné lieu à plusieurs réalisations concrètes, a ainsi permis aux linguistes auparavant bridés par le papier et les techniques traditionnelles d’exprimer plus librement leurs besoins et leurs exigences. Plusieurs recherches récentes déjà publiées montrent l’efficacité de ce mouvement et le caractère novateur des acquis ainsi obtenus. A partir d’un exemple concret d’édition numérique interactive, notre présentation détaillera les enjeux méthodologiques liés à ces nouveaux outils et à ces nouvelles pratiques, en proposant une réflexion sur le concept de « philologie numérique » et en montrant ses principaux apports pour la recherche diachronique. Cette question sera illustrée en particulier par la question de la segmentation des mots.
- Published
- 2021
6. Storia di un ornitorinco : note sulla collaborazione in progetti di edizione scientifica digitale
- Author
-
Leclerc, Elise, Saïdi, Samantha, Laboratoire Universitaire Histoire Cultures Italie Europe (LUHCIE), Université Grenoble Alpes (UGA), Triangle : action, discours, pensée politique et économique (TRIANGLE), Centre National de la Recherche Scientifique (CNRS)-Sciences Po Lyon - Institut d'études politiques de Lyon (IEP Lyon), Université de Lyon-Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Université Lumière - Lyon 2 (UL2)-École normale supérieure - Lyon (ENS Lyon), Paola Moreno, Hélène Miesse, Bárbara Bordalejo, Loredana Chines, Paola Italia, Pasquale Stoppelli, École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Sciences Po Lyon - Institut d'études politiques de Lyon (IEP Lyon), and Université de Lyon-Université de Lyon-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
filologia italiana ,Italie ,philologie ,edizione digitale ,filologia computazionale ,[SHS.LITT]Humanities and Social Sciences/Literature ,manuscrits ,Storia d'Italia -- Guicciardini ,Collazione ,The history of Italy -- Guicciardini ,manoscritti ,storia ,Italia ,[SHS.SCIPO]Humanities and Social Sciences/Political science ,[SHS.HISPHILSO]Humanities and Social Sciences/History, Philosophy and Sociology of Sciences ,Italy ,histoire ,Histoire d’Italie -- Guichardin ,digital humanities ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,philologie numérique - Abstract
Vol. 2019 paru en 2020; International audience; Les éditions scientifiques numériques ne sont plus une nouveauté dans le paysage scientifique international et leur prolifération a encouragé la communauté des chercheurs engagés dans leur production, à élaborer des normes et des réflexions théoriques sur les spécificités de ces éditions. Le contraste entre l'entreprise traditionnellement solitaire de la philologie et la dimension "naturellement" collaborative de la philologie numérique - due à la somme des compétences techniques et scientifiques requises pour produire de telles éditions - a souvent été souligné. Le présent article montrera que, dans la pratique, la publication d'une édition savante imprimée était déjà le résultat d'une collaboration entre chercheurs et éditeurs. On pourrait alors se demander si l'importance de ce contraste dans l'imaginaire reflète le relâchement des relations entre les premiers et les seconds, au point qu'ils n'aient plus été perçus comme de véritables collaborateurs? La dimension collaborative renouvelée de l'entreprise philologique dans l'environnement numérique apparaît donc comme l'un des nombreux défis méthodologiques, et un problème qui reste ouvert. Issus d'une expérience unique, et à certains égards singulière, les notes suivantes présentent, à travers le projet de l'édition numérique de l'exorde de la Storia d'Italia de Guicciardini, un exemple des opportunités et des succès d'un projet, mais aussi de ses limites.; Le edizioni scientifiche digitali (ESD) non sono più delle novità nel paesaggio scientifico internazionale, anzi: il loro moltiplicarsi ha contribuito a rafforzare la comunità di studiosi impegnati nella loro realizzazione, dando luogo sia all’elaborazione di standard ormai ben accettati sia a riflessioni teoriche sulle specificità di quelle edizioni. Si è spesso evidenziato il contrasto tra l’impresa tradizionalmente solitaria del filologo e la dimensione collaborativa ‘per natura’ della filologia digitale – dovuta alla somma di competenze tecniche e scientifiche richieste per realizzare tali edizioni. Se, in pratica, anche la pubblicazione di un’edizione scientifica cartacea è tuttora il frutto di una collaborazione, tra studiosi e case editrici, la pregnanza di quel contrasto nell’immaginario riflette forse l’allentarsi dei rapporti tra i primi e i secondi, tanto che non sono più percepiti come una collaborazione vera e propria. Comunque sia, la rinnovata dimensione collaborativa dell’impresa filologica in ambiente digitale appare come una tra le tante sfide metodologiche lanciate, e un problema tuttora aperto. Nate da una singola, e per alcuni versi singolare esperienza, quella dell'edizione digitale della Storia d'Italia de Guicciardini, le note che seguono presentano un esempio delle opportunità e dei successi di un progetto, ma anche dei suoi limiti, e vengono qui presentate nella speranza che le considerazioni che ne seguono siano di utilità per chi voglia iniziare un’impresa simile.
- Published
- 2020
- Full Text
- View/download PDF
7. Cohérence de l’alphabet meigretiste
- Author
-
Hsueh, Chia-Hung
- Subjects
Renaissance ,Typème ,Grammatologie ,Linguistique de corpus ,Philologie numérique ,Histoire de l’orthographe française ,Humanisme ,Histoire des théories linguistiques à la Renaissance française - Abstract
Cet article expose un parcours, le nôtre, dans lequel nous affrontons les problèmes soulevés par l’établissement de l’alphabet de Meigret ainsi que par la numérisation des ouvrages scripturaux du grammairien. La cohérence de cet alphabet et de son écriture est donc non seulement un constat à montrer, mais surtout un ensemble de dispositifs méthodologiques et technologiques à monter. Dans quelle mesure le système scriptural est-il développé dans une cohérence ?, This article outlines a path, our own, in which we confront the problems raised by the establishment of Meigret’s alphabet and the digitization of the grammarian’s scriptural works. The coherence of this alphabet and its writing is thus not only a statement to be shown, but above all a set of methodological and technological devices to be set up. To what extent is the scriptural system coherently developed ?
- Published
- 2020
- Full Text
- View/download PDF
8. Un modèle de reconnaissance automatique des entités nommées et des structures textuelles pour les corpus diplomatiques médiolatins
- Author
-
Torres Aguilar, Sergio, Dynamiques patrimoniales et culturelles (DYPAC), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Université Paris-Saclay, Pierre Chastang, and Xavier Tannier
- Subjects
Diplomatique ,Named entities recognition ,Digital philology ,Medieval history ,Reconnaissance des entités nommées ,Diplomatics ,Philologie numérique ,Medieval Latin ,Humanités numériques ,[SHS.HIST]Humanities and Social Sciences/History ,Histoire médiévale ,Latin TAL ,Digital humanities - Abstract
In this thesis, we present two computer models to structure textual information for large databases of medieval charters. The two models, one applied to the recognition of named entities, the other to the detection of parts of the diplomatics discourse, are supervised Conditional random fields (CRF) models trained on a hand-annotated corpus of medieval charters. ( orpus Burgundiae Medii Aevi or CBMA).The main Named Entity Recognition model has proven to be robust in its application to widely varying corpora in size, chronology and origin. The secondary model detecting parts of the diplomatic discourse, although less efficient, remains valid as a structuring tool. At the moment both can be used for indexing and studying a wide variety of diplomatics sources, thus saving huge human efforts.We have developed different solutions to overcome the gap between model's dependence on its original training-set and its ability to be applied to other corpora. Similarly, various corrections and additions were made to the golden-corpus from several historical and linguistic analysis concerning writing phenomena in charters, which greatly helped to improve the initial performance.In a later step we applied our automatic tools in the recognition of names of people, places and parts of the diplomatics discourse on thousands of charters from the CBMA corpus in order to study different questions concerning historical science and diplomatics. These studies concern the semi-automatic dating of a non-dated cartulary; the evolution of the spatial vocabulary in the charters of the central Middle Ages and the indexing of charters from their scriptural modules, in particular formulae of the charter protocols. This studies has a twofold purpose: on the one hand have shown different strategies for abstracting and adapting to the automatic processing well-known methods of research in history; on the other hand, seek to provide us tools with an applicative framework to obtain relevant knowledge to the historical science using massive processing.; Nous présentons dans cette thèse deux modèles informatiques développés pour délivrer de l'information structurée et applicables à de grandes bases de données de textes médiévaux. Les deux modèles, l'un appliqué à la reconnaissance des entités nommées, l'autre à la détection des parties du discours diplomatique, ont suivi un apprentissage supervisé utilisant la méthode des Champs aléatoires conditionnelles (CRF) sur un corpus manuellement annoté de actes médiévaux (Corpus Burgundiae Medii Aevi ou CBMA).Notre modèle principal de reconnaissance d'entités nommées a prouvé sa robustesse lorsqu'il a été appliqué sur des échantillons de corpus de taille, chronologie et origine très variés. Le modèle secondaire détectant les parties du discours diplomatique, bien que moins performant, s'est montré valide comme outil de structuration. Ils peuvent à présent être utilisés pour l'indexation et l’étude d’une grande variété de sources diplomatiques, économisant, ainsi des considérables efforts humains.Nous avons développé différentes solutions destinées à trouver un juste équilibre entre la dépendance du modèle à son corpus d'origine et sa capacité à être appliqué à d’autres corpus. De même, différents ajouts et corrections ont été opérés sur le corpus de référence à partir de plusieurs observations de type historique et linguistique concernant les documents utilisés, ce qui a permis d'améliorer la performance initiale.Nous avons ensuite appliqué les outils ainsi générés à la reconnaissance de noms de personnes, de lieux et de parties du discours diplomatique sur des milliers d'actes du CBMA afin d'étudier différentes questions intéressant la science historique et la diplomatique. Ces études concernent la datation semi-automatique d'un cartulaire qui en était dépourvu ; l'évolution du vocabulaire spatial dans les actes du Moyen Âge Central; et l'indexation des documents à partir des modules les intégrant, notamment les formules du protocole des actes. Par ces études nous poursuivons un double objectif: illustrer différentes stratégies permettant d'abstraire et d'adapter au traitement automatique des données des méthodes de recherche classiques en Histoire ; démontrer que nos outils de traitement massif permettent la génération de connaissances pertinentes pour la science historique.
- Published
- 2019
9. Un modèle de reconnaissance automatique des entités nommées et des structures textuelles pour les corpus diplomatiques médiolatins
- Author
-
Torres Aguilar, Sergio Octavio
- Subjects
Multidisciplinaire, généralités & autres [A99] [Arts & sciences humaines] ,Digital philology ,Diplomatics ,Medieval history ,Digital humanities ,Named entities recognition ,Medieval Latin ,Humanités numériques ,Reconnaissance des entités nommées ,Latin TAL ,Histoire médiévale ,Philologie numérique ,Diplomatique ,Multidisciplinary, general & others [A99] [Arts & humanities] - Published
- 2019
10. Les Carmina de Giovanni Pascoli : édition traduite et commentée d’une sélection de poèmes latins et édition numérique d’une sélectionde brouillons
- Author
-
Orsini, Sarah, Université Grenoble Alpes - UFR Langage, lettres et arts du spectacle, information et communication - Dpt Journalisme (UGA UFR LLASIC J ), Université Grenoble Alpes (UGA), Université Lumière - Lyon 2 (UL2), Histoire et Sources des Mondes antiques (HiSoMA), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), LITT&ARTS. Arts et pratiques du texte, de l’image, de l’écran et de la scène (LITT&ARTS), Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes (UGA), Université Lyon 2 Lumière, Università Roma Tre, Bruno Bureau, Giuseppe Leonelli, and Orsini, Sarah
- Subjects
Poesia Moderna ,Philology and paleography ,Filologia Classica ,[SHS.LITT]Humanities and Social Sciences/Literature ,Italian poetry ,Giovanni Pascoli ,Poetry 19-21th century - Supervielle - Saint-John Perse - Char - zoopoetics - exotism - alterity - literary genres - surrealism - lierature and science - literature and arts ,[SHS.LITT] Humanities and Social Sciences/Literature ,Ricezione ,Reception of Greco-Roman antiquity ,Classic literature ,Philologie numérique ,[SHS.CLASS]Humanities and Social Sciences/Classical studies ,Digital humanities ,Poesia italiana ,Poésie 19e siècle ,Neolatino ,Littérature italienne -- 19e siècle ,Réception antiquité ,Filologia computazionale ,Génétique de l’écriture ,Digital philology ,Genetic Edition ,Philologie classique ,[SHS.CLASS] Humanities and Social Sciences/Classical studies ,Littérature latine ,Humanités numériques ,Poesia latina ,Néo-latin ,Neo-latin poetry - Abstract
Giovanni Pascoli (1855-1912) is a classic of Italian literature. A bilingual poet writing in Italian and Latin. He has distinguished himself in the field of Neo-Latin literature by composing poems awarded in the certamen poeticum hoeufftianum. His Latin work, the Carminas, is almost unknown in France. The first objective of this doctoral research is to propose a bilingual edition, translated and commented, of a selection of Pascoli's Latin poems, accessible to a French audience not specialised in Latin or Italian literature. We have tried to select poems of various forms (narrative poems, epigrams, dedications odes) in order to give the reader an idea of what a complete edition of the Carmina could be like. In the introduction, we presented the biographical elements and the various aesthetic and linguistic aspects of Pascolian poetry that could facilitate the understanding of the texts. We also offer an analysis of the practice consisting in writing in Latin as a poetic experiment, and tried to situated this practice in relation to his contemporaries. We also tried as much as possible to study Pascoli's Latin poetry in relation to his Italian poetry. The second aspect of this thesis concerns the posthumous nature of this work, edited by the poet's sister, Maria Pascoli, with the help of philologist Ermenegildo Pistelli. Since the poet did not have time to propose a structure of his work in a collection, the Latin poems are organized according to thematic sections that are not always satisfactory (for example, the epigrams are published without organizational logic in a section containing all the short poems or the poems that could not be classified in the thematic sections). The digitization of all of G. Pascoli's drafts enabled us to explore the drafts of the author's plans, and we propose two possible collections in the introduction to this thesis: the first organized according to the chronology of the writing, the second organized according to the chronology of the facts represented. Our commented edition of the Carmina is presented according to the first organization, in order to offer an overview of Pascoli's writing as a process that has evolved over time. This study of the Pascholian writing process was also carried out at the poem level, in the detail of the composition. We made an XML-TEI genetic edition of a draft folder, that of the poem Crepereia Tryphaena. In this edition, we have described with great precision the writing gestures visible on the page (add, delete, substitute, move, rewrite a new version) and we have tried, when possible, to analyze the mental operations that caused these gestures. We have also tried to reconstruct the chronology of the writing of each draft, in order to create an editing prototype that allows us to read the drafts of poetry by displaying the text one writing campaign after the other and to visualize the modifications made by the author up to the scale of the letter. Thanks to this edition, we were able to analyse in detail the composition steps, the methods used by the author and the gestures made to carry out his project, and we deliver the results of this analysis at the end of the introduction of this thesis., Giovanni Pascoli (1855-1912) est un classique de la littérature italienne. Poète bilingue écrivant en italien et en latin, il s’est illustré dans le domaine de la littérature néo-latine en composant des poèmes qui ont remporté le certamen poeticum hoeufftianum. Son œuvre latine, les Carmina, est méconnue en France. Le premier objectif de cette recherche doctorale est de proposer une édition bilingue traduite et commentée d’une sélection des poèmes latins de Pascoli, accessible à un public français non spécialiste de littérature latine ou italienne. Nous avons tenté de sélectionner des poèmes de formes variées (poèmes narratifs, épigrammes, odes dédicatoires) afin de donner au lecteur un aperçu de ce que pourrait être une édition intégrale des Carmina. Nous avons présenté en introduction les éléments biographiques et les diverses aspects esthétiques et linguistiques de la poésie pascolienne susceptibles de faciliter la compréhension des textes. Nous y proposons également une analyse de l’expérience poétique que représente pour Pascoli le fait d’écrire en latin et de situer cette pratique par rapport à ses contemporains. Nous avons en outre essayé autant que possible d’étudier la poésie latine de Pascoli au contact de sa poésie italienne. Le second aspect de cette thèse porte sur le caractère posthume de cette œuvre, éditée par la sœur du poète, Maria Pascoli avec l’aide du philologue Ermenegildo Pistelli. Le poète n’ayant pas eu le temps de proposer une structuration de son œuvre en recueil, les poèmes latins sont organisés selon des sections thématiques qui ne sont pas toujours satisfaisantes (par exemple, les épigrammes sont éditées sans logique d’organisation dans une section rassemblant tous les poèmes de forme brève ou les poèmes qui n’ont pu être classés dans les sections thématiques). Grâce à la numérisation de l’ensemble des brouillons de G. Pascoli, nous avons pu explorer les ébauches de plans réalisés par l’auteur, et nous proposons dans l’introduction de cette thèse deux recueils possibles : le premier organisé selon la chronologie de l’écriture, le second organisé selon la chronologie des faits représentés. Notre édition commentée des Carmina est présentée selon la première organisation, afin d’offrir un aperçu de l’écriture de Pascoli comme un processus qui a évolué au fil du temps. Cette étude du processus de l’écriture pascolienne, nous l’avons également menée à l’échelle du poème, dans le détail de la composition. Nous avons réalisé une édition génétique XML-TEI d’un dossier de brouillons, celui du poème Crepereia Tryphaena. Dans cette édition, nous avons décrit avec une très grande précision les gestes d’écriture visibles sur la page (ajouter, supprimer, substituer, déplacer, réécrire une nouvelle version) et nous avons tenté, quand cela était possible d’analyser les opérations mentales qui ont provoqué ces gestes. Nous avons en outre tenté de reconstituer la chronologie de l’écriture de chaque brouillon, afin de créer un prototype d’édition qui permette de lire les brouillons de poésie en affichant le texte une campagne d’écriture après l’autre et de visualiser les modifications apportées par l’auteur jusqu’à l’échelle de la lettre. Grâce à cette édition, nous avons pu analyser dans le détail les étapes de composition, les méthodes employées par l’auteur et les gestes effectués pour mener à bien son projet, et nous livrons les résultats de cette analyse à la fin de l’introduction de cette thèse, Giovanni Pascoli (1855-1912) fa parte dei classici della letteratura italiana. Poeta bilingue scrivendo in italiano e in latino, è diventato famoso nell’ambito della letteratura neolatina per avere composto poemi premiati o lodati quasi ogni anno dal 1892 al certamenpoeticum hoeufftianum. La sua opera latina, i Carmina, è sconosciuta in Francia.Il primo obbiettivo di questa ricerca dottorale è di proporre un’edizione bilingue tradotta e commentata di una selezione dei poemi latini del Pascoli e di rendere quest’edizione accessibile a un lettorato francese che non sia specialista né di letteratura latina né di letteratura italiana. Abbiamo provato a selezionare poemi di forme varie (poemi narrativi, epigrammi, odi dedicatorie) per poter dare al lettore una visione d’insieme di quello che potrebbe essere un’edizione integrale dei Carmina. Abbiamo presentato in introduzioneelementi biografici e vari aspetti estectici e linguistici della poesia pascoliana suscettibili di agevolare la comprensione dei testi. Ci presentiamo anche un’analysi delle modalità della scrittura in latino come esperienza poetica, ambientando questa pratica nel contesto culturale in cui scriveva il Pascoli. Abbiamo inoltre provato a studiare la poesia latina del Pascoi al contatto di quella italiana.Il secondo aspetto di questa tesi riguarda il carattere postumo dei Carmina, la cui edizione princeps è stata realizzata da Maria Pascoli e Ermenegildo Pistelli. Il poeta non ha avuto il tempo di raggruppare i suoi poemi in una raccolta strutturata, quindi i Carmina sono stati organizzati in sezioni tematiche che non sono sempre soddisfacenti (per esempio, gli epigrammi sono pubblicati senza logica di organizzazione in una sezione ragruppando poemi di forma breve e poemi che non entravano nei temi delle sezioni). Grazie alla digitalizzazione dell’insieme delle carte di G. Pascoli, abbiamo potuto esplorare i tentativi di strutturazionedell’opera realizzati dal poeta, e proponiamo nell’introduzione di questa testi due strutture possibili : la prima secondo la cronologia della scrittura, e l’altra secondo la cronologia dei fatti rappresentati. Abbiamo scelto per presentare l’edizione commentata dei Carmina la prima struttura, per permettere di visualizzare la scrittura dei Carmina come un processo che ha evoluto nel tempo.Questo studio del processo della scrittura pascoliana, l’abbiamo anche portato al livello del poema, nel dettaglio della composizione. Abbiamo costituito un’edizione genetica XMLTEI di una cartella di carte, quella del poema Crepereia Tryphaena. In questa edizione, abbiamo descritto con una massima precisione possibile i gesti di scrittura visibili sulla pagina (aggiungere, cancellare, sostituire, spostare, riscrivere una nuova versione), e abbiamo tentato, quando era possibile, di analizzare le operazioni mentali che hanno provocato questi gesti. Inoltre, abbiamo provato a ricostituire la cronologia della scrittura di ogni carta, percreare un prototipo di edizione che permetta di leggere le carte di una poesia facendo apparire una stesura dopo l’altra, e permettendo di visualizzare le modifiche fino al livello della lettera. Grazie a quest’edizione abbiamo potuto analizzare precisamente le varie tappe della composizione di poesia, i metodi usati dall’autore et i gesti effettuati per condurre il suo progetto creativo. Presentiamo i risultati di quest’analisi alla fine dell’introduzione della tesi.
- Published
- 2019
11. Le positionnement éditorial dans l’édition critique numérique
- Author
-
Joana Casenave, Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication - ULR 4073 (GERIICO ), and Université de Lille
- Subjects
philologie ,édition numérique ,digital editing ,[SHS.INFO]Humanities and Social Sciences/Library and information sciences ,General Arts and Humanities ,Philosophy ,philology ,General Social Sciences ,Edition critique ,lcsh:History of scholarship and learning. The humanities ,Critical editing ,Critical edition ,lcsh:QA75.5-76.95 ,[SHS]Humanities and Social Sciences ,Computer Science Applications ,digital philology ,Digital humanities ,lcsh:AZ20-999 ,humanités numériques ,lcsh:Electronic computers. Computer science ,digital humanities ,Publication process ,Humanities ,philologie numérique ,Digital edition - Abstract
Critical editing is a practice whose contours have been well established by the philological tradition. The different critical conventions are well known and have been subject to a myriad of scientific studies. Nevertheless, critical edition has been undergoing changes since the development of new technologies. Digital critical editions have multiplied and today represent a large and varied panel. As a consequence, it’s worth observing, beyond technological innovations, what digital editing brings in terms of methodology and publishing conceptualisation. Obviously, in digital editions as in traditional editions, the final goal is offering readers a text that they will be able to consult and use in their research: the edited text should be a stable one, that can be an authoritative resource. The uniqueness of digital edition’s design, however, requires editors to reflect, right from the start of the publication process, on the information that they are going to provide, as well as on the way in which they will be presenting it. From the very beginning of its development, digital editing entails, then, a true awareness of how it will be received. It permits, also, a significant diversification of information presented in editions. It ultimately distinguishes itself with its open nature: digital editing is open in terms of content evolution over time just as it is in terms of collaborative editing. Résumé L’édition critique est une pratique dont les contours ont été bien établis par la tradition philologique. Les différents courants critiques sont bien connus et ont fait l’objet de nombreuses études scientifiques. Cependant, depuis le développement des nouvelles technologies, l’édition critique est en pleine mutation. Les éditions critiques numériques se sont multipliées et constituent aujourd’hui un panel large et varié. Dès lors, il importe d’observer, au-delà des innovations techniques, ce que l’édition numérique apporte en termes de méthodologie et de conceptualisation de l’édition. Bien évidemment, dans l’édition numérique comme dans l’édition traditionnelle, l’objectif final consiste à proposer au lecteur un texte qu’il va pouvoir consulter et utiliser dans ses recherches: le texte édité doit être un texte stable, qui puisse faire autorité. Cependant, la spécificité de conception des éditions numériques oblige les éditeurs à s’interroger, dès le début du processus d’édition, sur les informations qu’ils vont fournir, ainsi que sur la manière dont ils les présenteront. L’édition numérique implique alors, dès le début de son développement, une réelle prise en compte de la réception. Elle permet également une diversification importante des informations présentées dans l’édition. Elle se démarque enfin par son caractère ouvert: l’édition numérique est ouverte en termes d’évolution de contenu dans le temps tout comme en termes de collaboration au travail d’édition. Mots-clés: Edition critique; philologie; humanités numériques; édition numérique; philologie numérique
- Published
- 2019
- Full Text
- View/download PDF
12. Les catalogues et GROBID
- Author
-
Gabay, Simon, Khemakhem, Mohamed, Romary, Laurent, and Gabay, Simon
- Subjects
[SHS.LITT] Humanities and Social Sciences/Literature ,Catalogue of manuscripts ,GROBID-Dictionaries ,[INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL] ,Digital philology ,education ,Auctions and Markets ,Ventes aux enchères ,Catalogue de manuscrits ,Philologie numérique ,[INFO.INFO-HC] Computer Science [cs]/Human-Computer Interaction [cs.HC] ,[STAT.ML] Statistics [stat]/Machine Learning [stat.ML] ,TEI-XML - Published
- 2018
13. La transposition numérique de l'édition critique : éléments pour une édition de l'Isopet 1- Avionnet
- Author
-
Casenave, Joana, Marcoux, Yves, and Boivin, Jeanne-Marie
- Subjects
Critical Edition ,Critical Edition History ,Digital Humanities ,Digital Edition ,Fables ,Fables ésopiques ,Digital Philology ,Philologie numérique ,Edition critique ,Histoire de l'édition critique ,Humanités numériques ,Edition numérique - Abstract
Située au point de rencontre de la philologie et des sciences de l’information, cette thèse vise à analyser les développements les plus récents de l’édition critique. Compte tenu des transformations en cours dans la culture éditoriale, la méthode solidement établie de l’édition critique traditionnelle se trouve aujourd’hui confrontée à des questions d’ordre épistémologique tout à fait nouvelles. Les éditeurs doivent intégrer dans leur travail et leurs méthodes éditoriales les transformations consécutives à l’essor des techniques informatiques. C'est précisément la question de la transposition numérique de l'édition critique qui est abordée ici. Nous souhaitons interroger cette notion, qui nous paraît centrale, de la continuité entre les deux domaines – celui de l’édition traditionnelle et celui de l’édition numérique. Dans une première partie consacrée à l’édition critique traditionnelle, après un rappel historique et méthodologique qui nous permet de replacer l’édition critique dans son contexte culturel spécifique, nous étudions les modalités de traitement de l’édition critique et analysons la démarche éditoriale du philologue. L’édition critique n’est généralement pas réductible à une simple pratique mais est sous-tendue par un ensemble conceptuel complexe. Dans une deuxième partie consacrée à l’édition critique numérique, nous étudions l'évolution que connaissent les concepts philologiques lors du passage au numérique et nous évaluons les possibilités techniques nouvelles apportées dans ce domaine par l'informatique. Ces questions, qui portent aussi bien sur la méthode de l'édition critique que sur la réception de l'œuvre éditée, sont au cœur de notre recherche. Nous accompagnons notre réflexion théorique d'un travail pratique d'édition critique réalisé sur un échantillon de fables médiévales issues de l'Isopet 1-Avionnet, que nous présentons dans la troisième partie de notre thèse., At the crossroads of philology and information sciences, this thesis aims at analyzing the most recent developments in critical edition. In view of the transformations currently taking place in editorial culture, the solidly established method of traditional critical edition is today confronted to new epistemological questions. Editors must now integrate into their work–and work methods–changes brought about by computer technology. This is precisely the question of the digital transposition of critical edition investigated here. We wish to ponder on the notion, which seems central to us, of the continuity between the domains of traditional edition and of digital edition. The first part of the thesis, dedicated to traditional critical edition, begins with a historical and methodological overview that allows us to position critical edition in its specific cultural context. We then analyze the information processing modes of critical edition and the editorial methods of philologists. Critical edition is generally not reducible to a single and simple practice, but is rather underpinned by a complex conceptual structure. The second part of the thesis is dedicated to digital critical edition. We first look at how philological concepts evolve in the passage from traditional to digital edition. Then we assess the new technical possibilities opened up in the domain by computer technology. These questions, pertaining as much to the method of critical edition as to the reception of the edited work, are at the heart of our research. We accompany our theoretical investigations with a practical part, presented in the third part of the thesis, consisting in the critical edition of a sample of fables taken from Isopet 1-Avionnet. Finally, the conclusion of our work includes the elements to be considered in the development of a theoretical model of digital critical edition., Thèse de doctorat réalisée en cotutelle avec l'Université Paris-Est Créteil (France).
- Published
- 2017
14. Jean-Baptiste Camps, La Chanson d’Otinel. Édition complète du corpus manuscrit et prolégomènes à l’édition critique
- Author
-
Camps, Jean-Baptiste
- Subjects
édition numérique ,philologie ,réception ,digital editing ,text history ,ecdotique ,epic ,traduction médiévale ,ecdotics ,computational methods ,digital philology ,codicologie ,scriptologie ,humanités numériques ,chanson de geste ,histoire des textes ,paléographie ,reception ,philology ,codicology ,stemmatology ,stemmatologie ,medieval translation ,linguistique computationelle ,ComputingMethodologies_DOCUMENTANDTEXTPROCESSING ,scriptology ,palaeography ,digital humanities ,philologie numérique - Abstract
The Chanson d’Otinel : Complete Edition of the Manuscript Corpus and Prolegomena to a Critical Edition. Part of the geste du roi, the Chanson d’Otinel had not been the subject of an edition since the pioneer work of F. Guessard and H. Michelant in 1858. Starting with the tangible objects that manuscripts are, and proceeding to the study of the tradition and work itself, this study aims to provide a new examination of all the available data, in order to enable a restoration of a song that has know an important diffusion in Medieval Europe, but whose scattered remains only are available to us.This study is given a firmly methodological orientation, and searches to apply to the edition the epistemological progresses brought by recent contributions in the field of textual criticism and ecdotics, as well as by what is now called “Digital Humanities”. It aims at overcoming the debate between “New” and Traditional Philology, based on the common errors method or of Bedierist inspiration, to place itself in the perspective of a “Fourth Way” and of an edition “oriented towards the tradition”.Digital scholarly editing and Digital Philology techniques are used in order to provide a full edition of the manuscript corpus, with “layered” transcriptions that give access to different representations and to the graphic system of all witnesses. The edition aims also at the study and description of the links between these witnesses, by suggesting a method of representation of textual variance and by rooting genealogical analysis in a global consideration of the tradition, including medieval translations (in Welsh, Norse, English) and derived versions.The modelling and description of manuscripts and their texts – formalised by an xml/tei model conceived for this edition but seeking to be of more general interest – is clearly oriented towards data mining, and computational as well as traditional analysis (Palaeography, Scriptometry, Stemmatology). Methods from the fields of mathematical modelling, statistics, algorithmic, and artificial intelligence are put to use, as well as processes seeking to allow interoperability, scalability, and systematisation of editorial work (optical character recognition, linguistic tagging, collation), in a workflow centred on analysis. Main used languages are xml (tei, xslt), r and Python.
- Published
- 2017
15. A glossary for Mme de Sévigné
- Author
-
Gabay, Simon, Gabay, Simon, and Université de Neuchâtel (UNINE)
- Subjects
Sévigné ,XVIIe siècle français ,[SHS.LITT] Humanities and Social Sciences/Literature ,Lexicography ,[SHS.LITT]Humanities and Social Sciences/Literature ,17th-century France ,Digital philology ,Lexicograhie ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,Philologie numérique ,Glossaire ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,Glossary - Abstract
International audience; Comment construire un glossaire pour la correspondance de Mme de Sévigné, tenant compte des archaïsmes et des modernismes? Quelles ressources lexicographiques anciennes et contemporaines? Comment encoder ce glossaire en XML-TEI?
- Published
- 2017
16. La ' philologie numérique ' : tentative de définition d'un nouvel objet éditorial
- Author
-
Céline Guillot, Alexei Lavrentiev, Thomas Rainsford, Christiane Marchello-Nizia, Serge Heiden, Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Lumière - Lyon 2 (UL2)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-École normale supérieure - Lyon (ENS Lyon)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020]), University of Oxford [Oxford], Interactions, Corpus, Apprentissages, Représentations (ICAR), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS), Richard Trachsler, Frédéric Duval, Lino Leonardi, Les auteurs remercient le LABEX ASLAN (ANR-10-LABX-0081) de l'Université de Lyon pour son soutien financier dans le cadre du programme 'Investissements d'Avenir' (ANR-11-IDEX-0007) de l'Etat Français géré par l'Agence Nationale de la Recherche (ANR)., École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), University of Oxford, and École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
français médiéval ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,philologie numérique ,diachronie - Abstract
Les linguistes travaillant sur l'histoire du français ont toujours basé leurs travaux de recherche sur des éditions scientifiques de textes anciens. Depuis bon nombre d'années, le développement de la linguistique de corpus et de ses méthodes empiriques a par ailleurs favorisé la constitution de grandes bases de données largement diffusées. Les besoins et les exigences des linguistes ont donc évolué et se sont progressivement accrus au fur et à mesure que le développement des technologies modernes rendait le recours à de nouveaux outils (concordances, index, calculs statistiques) indispensable à la recherche basée sur corpus et offrait d'une part des possibilités d'enrichissement des textes inédites jusque là (étiquetage morphologique, parsage syntaxique, etc.), d'autre part des possibilités étendues d'accès critique au texte de base (navigation entre niveaux de transcription suivant l'objet linguistique étudié, lecture synoptique de facsimilés et de transcriptions, etc.). Plus récemment, les progrès continus de la technologie ont également permis d'envisager la réalisation d'éditions d'un nouveau type. Les éditions numériques de textes anciens, de plus en plus nombreuses depuis les années 1990, ont permis d'explorer les nouvelles potentialités offertes par les outils informatiques et ont parallèlement mené au développement de nouvelles pratiques éditoriales. Le numérique a ainsi conduit les philologues éditeurs de textes à repenser et à redéfinir des pratiques qui pouvaient, par ailleurs, sembler relativement hétérogènes et diverses (Duval 2006). Le moment semble donc venu d'adopter une attitude réflexive à l'égard de l'ensemble de ces recherches et de mener une réflexion théorique et méthodologique dans le but de mieux définir ce que sont l'édition numérique, ses enjeux, ses principes et ses méthodes. La pratique et la théorisation de la philologie numérique ('digital philology') ont déjà fait l'objet de plusieurs publications majeures essentiellement anglophones (par exemple Burnard & al. 2006 et Ciula & al. 2006), sans parler de nombreux articles de la revue Literary and Linguistic Computing et de communications au colloque annuel Digital Humanities. Les publications sont nettement moins nombreuses dans le domaine de la philologie romane. Par ailleurs, les relations entre la philologie numérique et la philologie traditionnelle sont encore loin d'être définies et de nombreuses éditions continuent à être produites " à l'ancienne " (même si depuis plusieurs décennies toute édition passe par le médium électronique lors de sa production). Cette situation est dûe en partie au manque de consignes claires quant à la production d'une édition numérique, à l'absence d'un cadre de description précis des multiples usages qui peuvent en être fait au-delà de la simple lecture et de critères solides pour leur évaluation. En nous fondant sur notre expérience et sur l'Édition numérique interactive de la Queste del saint Graal (http://txm.bfm-corpus.org/txm), notre communication proposera une tentative de définition d'un objet éditorial d'un genre partiellement nouveau, dont nous aborderons les principales composantes : - l'étude de la tradition manuscrite et la procédure de choix du/des manuscrit(s) ; - l'apparat critique (introduction, notes, glossaire, index, recherches linguistiques, etc.) et la place de la traduction en langue moderne ; - l'établissement du texte : les types de transcription (plus ou moins diplomatique, plus ou moins normalisée), les possibilités de choix multiples à travers différentes facettes permettant une navigation interactive ; - les outils et les stratégies d'interrogation et de recherche ; - les modes et conditions de diffusion et les publics visés. Ce faisant, notre exposé détaillera les principaux enjeux méthodologiques et scientifiques liés aux outils numériques et aux pratiques éditoriales émergentes, en proposant une réflexion sur le concept de " philologie numérique ", et en montrant, à partir d'exemples de recherche concrets, ses principaux apports pour la recherche philologique et linguistique - mais aussi littéraire ou historique. Nous espérons que cette réflexion contribuera à promouvoir de nouvelles pratiques éditoriales qui allient la qualité du travail philologique à la facilité d'accès et d'usage pour différentes catégories d'utilisateurs.
- Published
- 2017
17. The Chanson d’Otinel : Complete Edition of the Manuscript Corpus and Prolegomena to a Critical Edition
- Author
-
Jean-Baptiste Camps, Études et édition de textes médiévaux (EETM), Université Paris-Sorbonne (UP4), Université Paris-Sorbonne - Paris IV, Dominique Boutet, and Camps, Jean-Baptiste
- Subjects
édition électronique ,philologie romane ,littérature médiévale ,[SHS.LITT]Humanities and Social Sciences/Literature ,Medieval Literature ,Digital Editing ,chanson d'Otinel ,Text History ,ecdotique ,[SHS.LITT] Humanities and Social Sciences/Literature ,Digital Humanities ,codicologie ,Ecdotics ,scriptologie ,humanités numériques ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,chanson de geste ,histoire des textes ,paléographie ,Circulation and Reception of oïl Literature ,circulation et réception de la littérature d'oïl ,Scriptology ,Romance Philology ,Digital Philology ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,Palaeography ,stemmatologie ,Stemmatology ,traductions médiévales ,[SHS.HIST] Humanities and Social Sciences/History ,Codicology ,Medieval Translations ,méthodes quantitatives ,[SHS.HIST]Humanities and Social Sciences/History ,philologie numérique ,Computational Methods - Abstract
Part of the geste du roi, the Chanson d'Otinel had not been the subject of an edition since the pioneer work of F. Guessard and H. Michelant in 1858. Starting with the tangible objects that manuscripts are, and proceeding to the study of the tradition and work itself, this study aims to provide a new examination of all the available data, in order to enable a restoration of a song that has know an important diffusion in Medieval Europe, but whose scattered remains only are available to us.This study is given a firmly methodological orientation, and searches to apply to the edition the epistemological progresses brought by recent contributions in the field of textual criticism and ecdotics, as well as by what is now called “Digital Humanities”. It aims at overcoming the debate between “New” and Traditional Philology, based on the common errors method or of Bedierist inspiration, to place itself in the perspective of a “Fourth Way” and of an edition “oriented towards the tradition”.Digital scholarly editing and Digital Philology techniques are used in order to provide a full edition of the manuscript corpus, with “layered” transcriptions that give access to different representations and to the graphic system of all witnesses. The edition aims also at the study and description of the links between these witnesses, by suggesting a method of representation of textual variance and by rooting genealogical analysis in a global consideration of the tradition, including medieval translations (in Welsh, Norse, English) and derived versions.The modelling and description of manuscripts and their texts – formalised by an xml/tei model conceived for this edition but seeking to be of more general interest – is clearly oriented towards data mining, and computational as well as traditional analysis (Palaeography, Scriptometry, Stemmatology). Methods from the fields of mathematical modelling, statistics, algorithmic, and artificial intelligence are put to use, as well as processes seeking to allow interoperability, scalability, and systematisation of editorial work (optical character recognition, linguistic tagging, collation), in a workflow centred on analysis. Main used languages are xml (tei, xslt), r and Python., Se rattachant à la geste du roi, la Chanson d'Otinel n'avait pas été rééditée depuis le travail pionnier de F. Guessard et H. Michelant en 1858. Partant des objets tangibles que sont les manuscrits pour aller vers l'étude de la tradition et de l'œuvre, ce travail se propose de réexaminer l'ensemble des données disponibles, en vue de permettre la restauration d'une œuvre qui a connu une diffusion importante dans l'Europe médiévale, mais que nous ne conservons qu'en l'état de vestiges épars.La thèse prend un parti résolument méthodologique, en cherchant à faire bénéficier l'édition des progrès épistémologiques engendrés tant par les contributions les plus récentes aux débats propres à l'ecdotique et à la critique textuelle que par ce qu'il est convenu d'appeler les « humanités numériques ». L'édition tente ainsi de dépasser l'opposition entre philologie « nouvelle » et traditionnelle, de la méthode des fautes communes ou d'inspiration bédiériste, pour se placer dans la perspective d'une « quatrième voie » et d'une édition « tournée vers la tradition ».Les techniques de l'édition électronique et de la philologie numérique sont sollicitées afin de fournir une édition complète du corpus manuscrit, qui, par des transcriptions « à couches », donne accès à différentes représentations et au système graphique des différents témoins. L'édition vise également à la description et l'analyse des liens que ces témoins entretiennent entre eux, en mettant en place une méthode de représentation de la variance textuelle et en cherchant à appuyer l'analyse généalogique sur une prise en compte globale de la tradition, incluant les traductions médiévales (galloises, norroises, anglaises) et les versions dérivées.Le travail de modélisation et de description des manuscrits et de leurs textes, formalisé par un modèle xml/tei conçu pour les besoins de cette édition mais se voulant de portée plus générale, est très nettement tourné vers l'exploitation des données, dans une perspective d'analyse quantitative doublée d'une approche plus traditionnelle (paléographie, scriptométrie, stemmatologie). Des méthodes relevant de la modélisation mathématique, de la statistique, de l'algorithmique et de l'intelligence artificielle sont mises en œuvre, ainsi que des traitements visant à permettre l'interopérabilité, la montée en masse et la systématisation du travail éditorial (reconnaissance optique de caractères, annotation linguistique, collation), au sein d'une chaîne éditoriale faisant la part belle à l'analyse. Les développements effectués sont principalement en xml (tei, xslt), r et Python.
- Published
- 2016
18. Philologie et herméneutique numériques
- Author
-
Mayaffre, Damon, Pincemin, Bénédicte, Valette, Mathieu, Viprey, Jean-Marie, BCL, équipe Logométrie : corpus, traitements, modèles, Bases, Corpus, Langage (UMR 7320 - UCA / CNRS) (BCL), Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA), Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet [Saint-Étienne] (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), Équipe de Recherche en Textes, Informatique, Multilinguisme (ERTIM), Institut National des Langues et Civilisations Orientales (Inalco), Centre Jacques-Petit - Archives, Textes et Science des Textes (ATST), Université de Franche-Comté (UFC), Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université Bourgogne Franche-Comté [COMUE] (UBFC), Franck Neveu, Les auteurs remercient le LABEX ASLAN (ANR-10-LABX-0081) de l'Université de Lyon pour son soutien financier dans le cadre du programme 'Investissements d'Avenir' (ANR-11-IDEX-0007) de l'Etat Français géré par l'Agence Nationale de la Recherche (ANR)., Mayaffre, Damon, Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), Université Jean Moulin - Lyon 3 (UJML), and Université de Lyon-Université de Lyon-Université Lumière - Lyon 2 (UL2)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-École normale supérieure - Lyon (ENS Lyon)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])
- Subjects
logométrie ,format de texte ,[SHS.STAT]Humanities and Social Sciences/Methods and statistics ,textométrie ,[SHS.STAT] Humanities and Social Sciences/Methods and statistics ,document numérique ,analyse de données textuelles ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,herméneutique numérique ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,philologie numérique - Abstract
International audience; La place croissante du numérique dans les pratiques langagières, textuelles et discursives, et le développement des données, ressources et outils numériques interrogent fondamentalement le linguiste.L'échange proposé s'ancrera plus spécifiquement dans le terrain de la linguistique textuelle et de l'analyse du discours, et décrira les modifications que le numérique implique dans la production et la circulation des textes et des discours, ainsi que dans les modalités de leur analyse et interprétation linguistiques. Ces modifications se situent à plusieurs niveaux.Modifications des formes langagières, textuelles et discursivesLa production verbale en contexte numérique (en ligne ou hors ligne) implique des modifications dans les formes langagières elles-mêmes (sur les plans graphique, morphographique, technomorphographique notamment) ; dans les formes phrastiques et discursives en production comme en réception (délinéarisation hypertextuelle par exemple, qui implique un énoncé de geste de la part du scripteur comme du lecteur) ;dans les dispositifs énonciatifs (locuteurs augmentés et collectifs, modification de la notion d'auteur) ;dans les genres textuels et discursifs (technogenres natifs de l'internet) ; dans le rapport entre écriture et lecture (phénomène d'écrilecture) ; ou dans la nature même des énoncés qui présentent une hybridité sémiotique inédite (éléments langagiers couplés à des éléments iconiques fixes ou animés, et/ou sonores).Modification du rapport aux données langagières, textuelles et discursivesPour le chercheur, le numérique modifie également le rapport à la langue et aux données linguistiques, aux textes et aux discours. Jusqu'à quel point le numérique modifie-t-il le mode de constitution de nos objets, de nos corpus, de nos observables ? A partir de leur expérience, les intervenants témoigneront de ce que la pratique numérique révèle de l'établissement des textes, de leur représentation et de leur analyse. Si le transfert massif des ressources papier vers des ressources numériques interroge, à un premier niveau, en donnant la possibilité de transformer le texte en un texte augmenté ou en un hypertexte doté de sa réticularité, le caractère nativement numérique de la plupart des documents contemporains questionne aujourd’hui le linguiste, à un deuxième niveau, en proposant de nouveaux observables pour de nouveaux parcours analytiques et interprétatifs.Modification de la circulation des productions nativesLes textes et discours circulent dans les environnements numériques natifs de manière inédite : leur investigabilité (searchability), la possibilité de leur redocumentarisation (passage d'un ensemble de traces éparses à un document via des outils de curation ou redocumentarisation) mais aussi leur imprévisibilité discursive (la captation des traces par les algorithmes producteurs apparemment autonomes de discours) les inscrivent dans une mémoire numérique explicite et quantifiable, différents des dispositifs interprétatifs et de reconnaissance culturelles qui structurent la compréhension d'un texte imprimé dans un contexte hors ligne. Enfin, dans les écosystèmes numériques natifs (du web 2.0), tout énoncé est fondamentalement et techniquement relationnel, ce qui ajoute une dimension supplémentaire et questionne par ailleurs la notion devenue évidente et nécessaire de dialogisme.Modifications théoriques et méthodologiques de la linguistiquePar conséquent, aux plans théoriques et méthodologiques, nous sommes amenés à problématiser l'incidence du numérique sur la démarche linguistique : ses questionnements, ses objectifs, ses méthodes. Comment la description de la langue peut-elle s'articuler avec les attestations qui gisent dans les immenses bases de données issues d'internet ? Les corpus apportent à la fois une relativisation des résultats qu'il faut accommoder avec la visée scientifique généralisante, et une quantification qui ouvre une nouvelle dimension à la description linguistique, passant du possible / impossible à un continuum de probabilités. Plus spécifiquement, pour la linguistique textuelle et l’analyse du discours, « l’archive universelle », « l’horizon d’attente » et la notion cardinale d’« intertextualité » ne sont-ils pas révolutionnés par la disponibilité et l’accessibilité d’une archive numérique immense et à chaque instant démultipliée ? Jusqu'à quel point le numérique change-t-il nos points de vue, c'est-à-dire nos lieux d'observation, sur la langue et les discours ? Inversement, l'approche numérique pourrait induire certains angles morts, à identifier et discuter, comme peut-être le "silence" des formes non attestées, ou l'occultation des cas singuliers par les phénomènes massifs.
- Published
- 2016
19. La « Vraye Astrée » d’Honoré d’Urfé, de l’œuvre au corpus
- Author
-
Delphine Denis
- Subjects
philologie ,L’Astrée ,Urfé (Honoré d’) ,philology ,corpus ,variation textuelle ,texte ,digital philology ,General Earth and Planetary Sciences ,édition ,editorial practices ,textual variation ,philologie numérique ,text ,General Environmental Science - Abstract
Dans quelle mesure, et de quelle manière, la confrontation d’un texte à un corpus en modifie-t-elle l’analyse ? Symétriquement, de quelle approche du texte la constitution d’un corpus est-elle tributaire ? L’exemple du projet éditorial de L’Astrée, aux deux volets complémentaires (édition critique / site internet), permet d’ébaucher quelques réponses à ces questions qui engagent tout autant une méthodologie qu’un arrière-plan épistémologique. Cette contribution se réclame d’une philologie actualisée, soucieuse de tenir compte des nouveaux espaces de dialogue entre linguistique et littérature. Honoré d’Urfé’s « True Astrée » : from Opus to Corpus This article aims at showing to what extent, and in which way confronting a text to a corpus alters its analysis. Reversly, how the gathering of a corpus depends on a particular reading of the text. The example of the double folded editorial project of L’Astrée (critical edition / website) enables to attempt a few answers to these questions, dealing as much with methods as with epistemological background. To this purpose, the present paper is based on a new approach to philology, willing to take into account the fields of dialogue between linguistics and literature.
- Published
- 2009
- Full Text
- View/download PDF
20. Ponctuer une œuvre médiévale au XXIe siècle : les principes éditoriaux de la Base de Français Médiéval
- Author
-
Lavrentiev, Alexei, Interactions, Corpus, Apprentissages, Représentations (ICAR), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS), Les auteurs remercient le LABEX ASLAN (ANR-10-LABX-0081) de l'Université de Lyon pour son soutien financier dans le cadre du programme 'Investissements d'Avenir' (ANR-11-IDEX-0007) de l'Etat Français géré par l'Agence Nationale de la Recherche (ANR)., École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS), and Lavrentev, Alexey
- Subjects
édition de texte ,collection BFM ,ponctuation médiévale ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,philologie numérique - Abstract
L'introduction de la ponctuation moderne et interprétative a été le choix de la grande majorité des éditeurs scientifiques des œuvres françaises médiévales. Ce choix, qui impose au lecteur une certaine interprétation du texte et le prive en partie de sa polysémie naturelle, s'est imposé dans les éditions traditionnelles sur papier, car un texte non ponctué ou reproduisant fidèlement la ponctuation scribale aurait été très difficile à comprendre pour un lecteur moderne. On sait par ailleurs que la ponctuation pouvait varier énormément d'un manuscrit à l'autre d'une même œuvre, ce qui fait que la ponctuation des manuscrits médiévaux n'est jamais (ou n'est que très rarement) celle de l'auteur. Les technologies numériques offrent désormais la possibilité de ne plus se limiter à une interprétation possible, mais de laisser le lecteur choisir une " facette " éditoriale (de la plus fidèle à la source à la plus interprétative et normalisée) qui lui convient le mieux. Bien entendu, aucune édition ou même transcription de manuscrit ne peut s'affranchir de choix éditoriaux et d'interprétations. La ponctuation stricto sensu est d'ailleurs étroitement liée aux autres dispositifs de la structuration graphique (séparation des mots, emploi de majuscules et de lettrine, mise en page...). Dans notre intervention, nous nous appuierons sur l'expérience de l'édition numérique de la Queste del saint Graal (http://catalog.bfm-corpus.org/qgraal_cm) pour présenter les règles de l'établissement de la ponctuation dans les différentes facettes du texte en ancien français avant d'engager une réflexion plus générale sur les principes éditoriaux qui sont en train s'établir dans le cadre de la Base de Français Médiéval.
- Published
- 2014
21. Inventory of lexemes of action verbs, a new methodology for gender studies research. An example with ʿAnatu of Ugarit
- Author
-
Juloux, Vanessa, Équipe Mondes sémitiques (OM-MS), ORIENT ET MÉDITERRANÉE : Textes, Archéologie, Histoire (OM), Université Paris 1 Panthéon-Sorbonne (UP1)-École pratique des hautes études (EPHE), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Collège de France (CdF (institution))-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS)-Université Paris 1 Panthéon-Sorbonne (UP1)-École pratique des hautes études (EPHE), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Collège de France (CdF (institution))-Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS), and Juloux, Vanessa
- Subjects
KTU 1 ,[SHS.LITT]Humanities and Social Sciences/Literature ,Philological Analysis ,Datamining ,Ougarit ,Ba‘lu ,[SHS.LITT] Humanities and Social Sciences/Literature ,Gender Studies ,Ugaritic lexicography ,Agency feminine ,Philologie numérique ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,[SHS.ANTHRO-SE] Humanities and Social Sciences/Social Anthropology and ethnology ,Baal ,Ugaritic ,Methodological proposals ,Methodologie ,Ugarit ,[SHS.ANTHRO-SE]Humanities and Social Sciences/Social Anthropology and ethnology ,[SHS.GENRE] Humanities and Social Sciences/Gender studies ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,Philologie comparée ,Ougaritique ,Agency ,Ugaritic epistolary texts ,Ugaritologie ,Ugaritology ,Methodological tool ,Anatu ,[SHS.GENRE]Humanities and Social Sciences/Gender studies - Abstract
International audience; Ugarit literary materials in alphabetic cuneiform have been mainly studied by Ugaritologists with a biblical background, their research pursued by their scientific heirs ; de facto their approach is less favorable to an impartial study of power relationships between different entities of opposite biological (as opposed to social) gender.Avoiding the trap of subjective interpretation makes it essential to use as neutral a tool as possible. The inventory of lexemes (IoL) proves to be such a tool for transparency analyses. Among other things it enables to highlight action verbs for each studied entity, be it divine or human, male or female. To determine social sex, the IoL of action verbs has been as unbiased a methodological tool as possible. Its interest is three-fold :1) for a “female”, to distinguish verbs associated to ‘heteronormativity’ or to the ‘performativity’ of sexual gender ; 2) to draw up statistics of action verbs to determine the agency of involving all entities and their influence ; 3) taking into account socio-political context and cultural areas, a semantic and comparative analysis of commonly used Ugaritic verbs will make it possible to analyze the lexical choice of verbs used by entities of social sex ‘man’ or social sex ‘woman’ from a representative corpus from Mari, Ebla, Emar, Nuzi, Ḫatti and Sumerian texts.For example, the IoL of West Semitic goddess ʿAnatu, one of the main protagonists of the Baʿlu Cycle from Ugarit, will be established. Let us consider the verb mḫṣ, “to kill or beat” used six times to describe ʿAnatu’s actions. What are the other verbs used for the same purpose in the same semantic field? In what sociopolitical and cultural context is it used elsewhere in the Ugaritic corpus ? By which biological or social sex?This parallelism will not be limited to the Ugaritic corpus but will be also compared to a list of equivalent action verbs belonging to the same semantic field in Hittite (kuen-), Sumerian (SIG3/RA) and Akkadian (maḫāṣu). The major objective is to determine whether the social sex of ʿAnatu can be determined, and her decisions legitimated, by examining the semantics of the action verbs according to the contexts and culturalareas.
- Published
- 2014
22. Le Psautier d'Arundel : une nouvelle édition
- Author
-
Pignatelli, Cinzia, Lavrentiev, Alexei, Centre d'Etudes Supérieures de Civilisation médiévale (CESCM), Université de Poitiers-Centre National de la Recherche Scientifique (CNRS), Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), Richard Trachsler, Frédéric Duval, Lino Leonardi, Centre National de la Recherche Scientifique (CNRS)-Université de Poitiers, École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet [Saint-Étienne] (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), and Lavrentev, Alexey
- Subjects
français médiéval ,latin médiéval ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,littérature religieuse ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,philologie numérique - Abstract
International audience; Le ms. Londres, BL Arundel 230, daté probablement de la seconde moitié du XIIe siècle, contient un Psautier bilingue à usage liturgico-dévotionnel où la traduction interlinéaire en anglo-normand, en très petite écriture, s'insère entre les longues lignes des versets latins, copiés dans un gros module. Le texte latin est encore très proche du Psautier romain, compilation diffusée en Angleterre avant la traduction hyéronymienne connue sous le nom de Psautier gallican, alors que la glose française a dû être composée à partir d'un psautier latin qui contenait un texte légèrement différent. Plusieurs auteurs (BERGER 1884 en premier) ont déjà remarqué la proximité entre cette traduction française et celle du Psautier d'Oxford (ms. Oxford, Bodleian Douce 320), qui apparaît comme la première traduction du psautier en français médiéval et qui, copiée sans le latin, répond à un besoin différent du cas courant de la liturgie. Alors que dans le Psautier d'Oxford la traduction se présente comme un texte suivi, sous forme unilingue, dans le Psautier d'Arundel les blocs de mots ne semblent pas tenir compte de la syntaxe française et sont plutôt disposés, comme des gloses, dans l'interligne du texte latin de sorte à se trouver en regard des groupes de mots latins correspondants. Cette disposition du texte français permet de se demander si le Psautier d'Arundel ne représenterait pas la forme primitive de la traduction du Psautier. BERGER 1884, 17 a déjà démontré qu'il ne faut pas attribuer cette importance au Psautier d'Arundel, dont la traduction est empruntée à un Psautier au texte continu de la famille du Psautier d'Oxford, que le copiste retourne, en l'adaptant plus ou moins bien mais en ayant toujours en vue de coller au plus près au texte latin souscrit. Si le copiste d'Arundel suit l'ordre des mots latins plus volontiers que celui d'Oxford, les traductions anglo-normandes du Psautier au XIIe siècle apparaissent de toute façon très serviles par rapport au texte biblique, qui impose un style particulier, et que parfois elles ne comprennent pas correctement. Comme nous l'avons déjà montré (PIGNATELLI 2009 et 2012), l'étroite dépendance à l'égard de la syntaxe latine y apparaît dans une mesure nettement supérieure à celle qu'on constate dans les textes traduits et non traduits de l'époque, malgré des dérogations à l'ordre des termes dans l'original qui avaient déjà été partiellement étudiées par HERMAN 1954. Pour l'édition du texte du Psautier d'Arundel, où le copiste a tenu à faire correspondre les blocs de mots de la traduction à ceux du latin, il est donc primordial de pouvoir respecter le parti de mise en texte du manuscrit, où le psautier latin constitue le cadre sur lequel la traduction française se calque " physiquement ". L'édition électronique permet aujourd'hui de résoudre ce type de problèmes grâce à une présentation 'multi-modale' ou 'multi-facettes' : par un simple jeu d'affichage, on peut ainsi avoir accès à différents types de transcriptions du texte enrichies d'annotations éditoriales. Nous procédons donc actuellement à une édition numérique du Psautier d'Arundel, menée avec l'aide des membres de l'équipe ICAR (CNRS / Université Lyon 2 / ENS de Lyon), et qui prévoit d'abord une remise à plat des lectures de BEYER. Le texte, balisé en XML en respectant les recommandations de la TEI P5, est ensuite soumis à des outils de visualisation, d'extraction et d'analyse des données fournis par la plateforme TXM développée au Laboratoire ICAR (HEIDEN / LAVRENTIEV 2012). L'utilisation de ces programmes, rendant possible l'alignement des textes et l'annotation des éditions, permet de visualiser, dans ses deux versions, semi-diplomatique et normalisée, l'étroite correspondance qui a été recherchée par le scribe entre le texte latin et sa glose. Le CILPR 2013 sera l'occasion de présenter pour la première fois le prototype d'édition numérique interactive de ce texte sur le portail web de la Base de Français Médiéval (http://txm.bfm-corpus.org/bfm), où la communauté scientifique pourra feuilleter les différents niveaux d'édition, utiliser les différentes fonctionnalités de recherche et d'analyse textométrique, et suivre l'évolution du chantier.
- Published
- 2013
23. Manier le thésaurus grec
- Author
-
Berra, Aurélien, Archéologies et Sciences de l'Antiquité (ArScAn), Centre National de la Recherche Scientifique (CNRS)-Ministère de la Culture et de la Communication (MCC)-Université Paris Nanterre (UPN)-Université Paris 1 Panthéon-Sorbonne (UP1), Anthropologie et Histoire des Mondes Antiques (ANHIMA), Université Paris 1 Panthéon-Sorbonne (UP1)-École des hautes études en sciences sociales (EHESS)-École pratique des hautes études (EPHE), Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS), Christian Jacob, Université Paris 1 Panthéon-Sorbonne (UP1)-Université Paris Nanterre (UPN)-Ministère de la Culture et de la Communication (MCC)-Centre National de la Recherche Scientifique (CNRS), Université Panthéon-Sorbonne (UP1)-Université Paris Nanterre (UPN)-Institut national de recherches archéologiques préventives (Inrap)-Ministère de la Culture et de la Communication (MCC)-Centre National de la Recherche Scientifique (CNRS), Université Panthéon-Sorbonne (UP1)-École des hautes études en sciences sociales (EHESS)-École pratique des hautes études (EPHE)-Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS), Université Paris 1 Panthéon-Sorbonne (UP1)-Université Paris 8 Vincennes-Saint-Denis (UP8)-Université Paris Nanterre (UPN)-Ministère de la Culture et de la Communication (MCC)-Institut national de recherches archéologiques préventives (Inrap)-Centre National de la Recherche Scientifique (CNRS), Textes, Histoire et Monuments de l'Antiquité au Moyen Age (THEMAM), and Université Paris 1 Panthéon-Sorbonne (UP1)-Université Paris 8 Vincennes-Saint-Denis (UP8)-Université Paris Nanterre (UPN)-Ministère de la Culture et de la Communication (MCC)-Institut national de recherches archéologiques préventives (Inrap)-Centre National de la Recherche Scientifique (CNRS)-Université Paris 1 Panthéon-Sorbonne (UP1)-Université Paris 8 Vincennes-Saint-Denis (UP8)-Université Paris Nanterre (UPN)-Ministère de la Culture et de la Communication (MCC)-Institut national de recherches archéologiques préventives (Inrap)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
dictionaries ,Thesaurus Linguae Graecae ,Perseus Digital Library ,[SHS.INFO]Humanities and Social Sciences/Library and information sciences ,grec ancien ,critical apparatus ,corpus ,apparat critique ,digital philology ,matérialité ,book ,études classiques ,thésaurus ,dictionnaires ,livre ,Estienne ,technology ,ancient Greek ,humanités numériques ,digital humanities ,Classics ,[SHS.CLASS]Humanities and Social Sciences/Classical studies ,materiality ,philologie numérique ,technologie - Abstract
In a period when a true digital philology is emerging, this paper offers a reflection on the changing ways of the scholarly handling of ancient Greek texts, from the ancient times themselves and the thesauri compiled in the Renaissance to the "Thesaurus Linguae Graecae" maintained but the University of California and the Perseus Digital Library developed at Tufts University.; Alors que se précise l'émergence d'une véritable philologie numérique, cet article propose une réflexion sur les transformations de notre maniement savant des textes grecs anciens, depuis l'Antiquité elle-même et les thésaurus de la Renaissance jusqu'au "Thesaurus Linguae Graecae" publié par l'université de Californie et à la Perseus Digital Library développée par l'université Tufts.
- Published
- 2011
24. TEI P5 Manuscript Transcriptions as a Resource for Linguistic Research
- Author
-
Lavrentiev, Alexei, Heiden, Serge, Lavrentev, Alexey, Interactions, Corpus, Apprentissages, Représentations (ICAR), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS), Les auteurs remercient le LABEX ASLAN (ANR-10-LABX-0081) de l'Université de Lyon pour son soutien financier dans le cadre du programme 'Investissements d'Avenir' (ANR-11-IDEX-0007) de l'Etat Français géré par l'Agence Nationale de la Recherche (ANR)., and École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
digital philology ,linguistique de corpus ,ancien français ,corpus linguistics ,Old French ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,TEI ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,philologie numérique - Published
- 2010
25. Tendances de la ponctuation dans les manuscrits et incunables français en prose, du XIIIe au XVe siècle
- Author
-
Lavrentiev, Alexei, Lavrentev, Alexey, Interactions, Corpus, Apprentissages, Représentations (ICAR), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS), Ecole normale supérieure Lettres et Sciences Humaines - ENS-LSH Lyon, Christiane Marhcello-Nizia, Base de Français Médiéval (http://bfm.ens-lyon.fr), and École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
ponctuation ,manuscrit médiéval ,corpus ,punctuation ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,langue française médiévale ,digital philology ,medieval manuscript ,incunabula ,diplomatic transcription ,Old French ,transcription diplomatique ,incunable ,XML-TEI ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,philologie numérique - Abstract
Medieval French punctuation still remains an underexplored field in historical linguistics, although some research has been carried out since 1970ies. Medieval punctuation is almost completely ignored by scholarly editions. However it does contain some useful linguistic data, as it allows to see what was the “natural” text structure for medieval scribes and gives the reader some guidelines for interpretation of a written message. The goal of this thesis is to contribute to the knowledge of major trends in the evolution of the practice of punctuation in medieval French manuscripts and incunabula in two ways. On the one hand a methodology of representation of primary sources and their linguistic analysis is elaborated. On the other hand, new data are introduced and analysed. The linguistic analysis in this thesis is based on the functional approach of the language. Its spoken and written forms are considered to be systems of marks having a number of functions. Not only conventional punctuation marks are studied, but also all the other linguistic marks that can “work together” with punctuation in organising text structures at different levels. The research has been based on corpus of “multi-level” transcriptions of 29 manuscript and incunabula fragments (28 000 words) fully marked up for “punctuable units”. The XML transcriptions are TEI conformant and are integrated into the BFM Old French corpus ., La ponctuation du français médiéval reste de façon générale un domaine peu étudié, malgré un certain nombre de recherches menées dans le domaine depuis une trentaine d'années. Généralement « masquée » par les pratiques d'édition « scientifique », elle constitue pourtant une donnée linguistique non négligeable : elle révèle les structures dont le texte était constitué pour le « sujet écrivant » et donne au lecteur une orientation dans l'interprétation du message écrit. La présente thèse vise à contribuer à la connaissance des grandes tendances de l'évolution des pratiques de la ponctuation dans les manuscrits et incunables français grâce d'une part au développement d'une méthodologie de représentation des données primaires et d'analyse linguistique de ces données tenant compte de multiples facteurs de variation et, d'autre part, grâce à l'apport de nouvelles données factuelles et à leur interprétation. L'analyse linguistique effectuée se base sur une approche fonctionnelle de la langue, qui considère l'oral et l'écrit comme des systèmes de marques remplissant un certain nombre de fonctions. Sont donc étudiés non seulement les signes de ponctuation, mais aussi les marques linguistiques pouvant l'accompagner dans la structuration du texte à ses divers niveaux. L'étude a été menée à partir d'un corpus de transcriptions « multi-facettes » de 29 extraits de manuscrits et d'incunables (28 000 occurrences-mots) exhaustivement annoté en « unités ponctuables ». Les transcriptions encodées en XML sont conformes aux recommandations de la TEI et sont intégrées à la Base de Français Médiéval .
- Published
- 2009
26. Language/Discourse : textual analysis, computer and statistics
- Author
-
Jean-Marie Viprey, Centre Jacques-Petit - Archives, Textes et Science des Textes (ATST), Université de Franche-Comté (UFC), and Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université Bourgogne Franche-Comté [COMUE] (UBFC)
- Subjects
Linguistics and Language ,media_common.quotation_subject ,Discourse analysis ,Object (grammar) ,corpus ,Language and Linguistics ,030507 speech-language pathology & audiology ,03 medical and health sciences ,digital philology ,textuality ,Sociology ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,media_common ,060201 languages & linguistics ,Point (typography) ,archive ,Constitution ,Field (Bourdieu) ,textualité ,06 humanities and the arts ,network-likeness ,Linguistics ,texte ,Philology ,0602 languages and literature ,discourse ,0305 other medical science ,discours ,Sentence ,Utterance ,text ,philologie numérique - Abstract
16 pages; International audience; Textual linguistics has been undergoing a continuous redefining of its internal and external boundaries after Halliday & Hasan's inaugural thesis. It notably concerns the concepts of text and discourse, and has led to the constitution of a new research field : Textual Discourse Analysis (TDA). We will start from two questions which were asked at the origin of this Congress : “What is a text – or the text –in the digital age?” and “Which new methods are available for textual analysis ?”. We assume that text is neither merely nor principally a linguistic object. It is at the meeting point of various fields and key-concepts : sentence, utterance, document, archive, basis and corpuses, discourse. Answers must be searched in digital philology as well as in the hermeneutic aspects of idiscourse analysis.
- Published
- 2009
27. A Tag For Punctuation
- Author
-
Lavrentiev, Alexei, Interactions, Corpus, Apprentissages, Représentations (ICAR), and École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
digital philology ,linguistique de corpus ,corpus linguistics ,ponctuation ,punctuation ,TEI ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,philologie numérique - Abstract
In this paper I will argue that it may be useful to introduce a special tag (e.g. ) for punctuation marks, which could join the TEI Analysis module along with , , and other "segLike" elements. I will first discuss the reasons why punctuation marks may need tagging, and then consider the TEI tags that might be used for that purpose. None of them appears to be perfect for this job. After discussing linguistic properties of punctuation marks, I will propose a tentative formal definition for the element.
- Published
- 2008
28. Philologie et/ou herméneutique numérique : nouveaux concepts pour de nouvelles pratiques ?
- Author
-
Mayaffre, Damon, BCL, équipe Logométrie : corpus, traitements, modèles, Bases, Corpus, Langage (UMR 7320 - UCA / CNRS) (BCL), Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA), and François Rastier et Michel Ballabriga
- Subjects
herméneutique ,logométrie ,textométrie ,corpus numérique ,corpus ,lexicométrie ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,herméneutique numérique ,philologie numérique - Abstract
L'enjeu des sciences du texte est moins d'administrer la preuve que de contrôler l'interprétation. Hors de l'obscurantisme théologique, il faut admettre en effet que les textes, et les corpus qui en informent le sens, n'ont point de Vérité mais de multiples compréhensions. Selon une pensée attribuée à Foucault, la vérité d'un texte est d'abord et seulement ce qu'on dit de lui, et déjà Chladenius remarquait que, loin de la stricte intentionnalité des auteurs, « l'on peut, lorsqu'on cherche à comprendre leurs écrits, former des pensées qui n'étaient pas venues à l'esprit de l'auteur » [Chladenius cité par Szondi 1989 : 32]. Seulement, sauf à verser dans un subjectivisme débridé et une interprétation divinatoire, « ce qu'on dit des textes » et ces « pensées » qu'il est permis d'avoir à propos d'eux, doivent être étayés, vérifiables, contrôlés. Cela passe par une composition/organisation ad hoc des corpus, une prise en considération minutieuse du matériel linguistique qui les constitue, et une démarche heuristique rigoureuse. Dans les trois cas, la révolution numérique apporte des réponses adéquates.
- Published
- 2006
29. Quelle place pour les sciences des textes dans l'Analyse de Discours ?
- Author
-
Jean-Marie Viprey
- Subjects
Acquisition de données ,Archive ,Philologie numérique ,Corpus ,Analyse textuelle de discours - Abstract
Introduction : texte et discours, encore et toujours…Contribuer, ne serait-ce qu’à l’état d’esquisses, comme le requiert l’argument de cette livraison de Semen, à donner des directions de travail claires pour l’analyse de discours, soulève une série de problèmes dont l’explicitation pourrait paraître déjà… une sérieuse contribution. Tout parcours bibliographique, même réduit, dans ce champ dont pourtant on a prononcé plusieurs fois l’épuisement, est un vertigineux (et parfois accablant) défi ...
- Published
- 2006
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.