18 results on '"Philologie numérique"'
Search Results
2. Un corpus pour la Sémantique interprétative
- Author
-
Pincemin, Bénédicte, Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA), Universidade Federal da Paraíba Brasil, Université Lumière Lyon 2, Université de Rouen, Institut National de Langues Orientales, Université de Moncton, Institut Ferdinand de Saussure, and Collectif La Reconstruction
- Subjects
[SHS.STAT]Humanities and Social Sciences/Methods and statistics ,Text Encoding Initiative TEI ,Analyse qualitative ,Analyse statistique des données textuelles ADT ,Sémantique interprétative ,Science ouverte ,Logiciel TXM ,Analyse quantitative ,Herméneutique numérique ,François Rastier ,Corpus numérique ,Philologie numérique ,Textométrie ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,Humanités numériques - Abstract
Session Axe 2 « Corpus, texte et méthodes » du 5 octobre 2022, coordonnée par Mathieu Valette.; International audience; Le projet Sittelle, initié en 2021 à l'occasion de la préparation des 35 ans de la Sémantique interprétative, construit progressivement un corpus des écrits de sémantique interprétative de François Rastier et propose de le parcourir avec des outils textométriques. Sa motivation est pédagogique (éclairer la compréhension par d'autres parcours de lecture), épistémologique (approfondir ou compléter la description de la pensée rastiérienne par des observations méthodiques) et linguistique (expérimenter une modélisation de structures textuelles et intertextuelles, approcher le fonctionnement des isotopies). Son mode d'organisation opte pour la science ouverte.Le contexte de cette session, questionnant la construction et l'exploitation des corpus numériques, est l'occasion de partager quelques questions rencontrées ou attendues dans la mise en oeuvre initiale de ce corpus d'écrits de Sémantique interprétative.
- Published
- 2022
3. Approche quantitative des marques graphiques et lexicales de l’oral représenté à travers les corpus BFM et BVH
- Author
-
Lavrentiev, Alexei and Lavrentiev, Alexei
- Abstract
This paper presents an experience of using digital text corpora, Base de français médiéval and Bibliothèques virtuelles humanistes, in a research on graphical and lexical markers of represented spoken utterances and citations of written sources. Depending on editing practices and on the state of markup, different queries may be applied to the whole corpora or to some parts of them. The indicators examined in the paper include the relative frequency of the verb dire (‘to say’), the frequency of different punctuation marks used at the borders of the structural elements of represented speech, and marks of written sources citations, L’article présente une expérience d’exploitation de corpus numériques, la Base de français médiéval et les Bibliothèques virtuelles humanistes, pour l’étude de la signalisation graphique et lexicale de l’oral représenté et des citations. Selon les méthodes d’édition et l’état de balisage, différentes requêtes peuvent être appliquées à l’ensemble des corpus ou à leurs parties. Les indicateurs étudiés incluent la fréquence relative du verbe dire, la fréquence des différentes marques de ponctuation utilisées aux frontières des éléments qui constituent les épisodes d’oral représenté et les marques de citation de sources écrites., En este artículo, presentamos una experiencia de uso de corpus digitales –la Base de français médiéval y las Bibliothèques virtuelles humanistes – para el estudio de la señalización gráfica y léxica del oral representado y del discurso citado. Según los métodos de edición y el estado del marcado, se pueden aplicar diferentes búsquedas al conjunto de los corpus o a algunas de sus partes. Los indicadores estudiados incluyen la frecuencia relativa del verbo dire (‘decir’), la frecuencia de los diferentes signos de puntuación empleados en las fronteras entre elementos que constituyen episodios de oral representado y, por último, las marcas de cita de fuentes escritas
- Published
- 2021
4. La Base de français médiéval et le consortium CAHIER : dix ans d'échanges et de collaborations
- Author
-
Lavrentiev, Alexei, Guillot, Céline, Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA), Consortium CAHIER, École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA), and Lavrentev, Alexey
- Subjects
[SHS.LITT] Humanities and Social Sciences/Literature ,[SHS.LITT]Humanities and Social Sciences/Literature ,TXM ,[INFO]Computer Science [cs] ,[INFO] Computer Science [cs] ,Philologie numérique ,TEI ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics - Abstract
International audience; Le projet de la Base de français médiéval (BFM, http://txm.bfm-corpus.org) fait partie des membres fondateurs du Consortium CAHIER. Les origines du projet remontent à la fin des années 1980 et son évolution a suivi, et parfois anticipé, les grandes tendances du développement des humanités numériques. L'expérience de la BFM a permis de contribuer à plusieurs chantiers du consortium CAHIER : l'accès libre aux données, les normes d'encodage (et notamment l'usage de la TEI), la typologie textuelle, la mise en place de chaînes éditoriales ouvertes. Les échanges qui se sont produits dans les groupes de travail et lors des ateliers du consortium permettent à leur tour d'améliorer les pratiques d'encodage et les outils proposés aux utilisateurs de la BFM et d'assurer une plus grande interopérabilité et pérennité des données.La constitution de la BFM a commencé par la numérisation de l'édition de la Queste del saint Graal d'A. Pauphilet (1923) et la base a été enrichie au fil des ans grâce à des vacations, aux contributions de doctorants de Ch. Marchello-Nizia, aux échanges avec des collègues et, plus récemment, grâce à des financements ANR. A ce jour, la BFM comprend 170 textes composés entre le 9e et le 15e siècle, soit près de 4,7 millions de mots. Pour la Queste del saint Graal l'édition de Pauphilet a d'ailleurs été remplacée dans le corpus par une édition numérique originale (Marchello-Nizia et Lavrentiev 2019). Une augmentation importante du corpus est prévue en 2021. Les textes de la BFM sont étiquetés en morphosyntaxe et lemmatisés (avec ou sans vérification) et bénéficient du balisage XML-TEI enrichi. En particulier, le discours direct est balisé dans l'ensemble du corpus, ce qui permet de mener des recherches sur l'oral représenté (Guillot-Barbance et al. 2018). De nombreuses thèses et travaux de recherche ont été réalisés grâce aux données de la BFM. Notamment, la partie médiévale du corpus de la Grande grammaire historique du français (Marchello-Nizia et al. 2020) est entièrement issue de la Base de français médiéval. La BFM est accessible en ligne grâce au logiciel « portail TXM » (http://textometrie.org), les textes peuvent être consultés librement et l'accès au moteur de recherche et d'analyse est donné gratuitement sur simple inscription (Guillot-Barbance et al. 2017).Quand la TGIR Corpus (prédécesseur d'Huma-num) lance en 2010 l'appel à la création de consortiums de corpus, la BFM faisait déjà, depuis 2004, partie du Consortium international pour les corpus de français médiéval (CCFM, http://ccfm.ens-lyon.fr). Cette organisation informelle, n'ayant jamais bénéficié d'un financement spécifique et dont l'activité s'est estompée après 2008, a néanmoins permis d'entamer la réflexion et de publier des documents de travail sur les normes communes d'encodage et de description des textes, ainsi que sur les conditions d'accès aux corpus et d'échange de données. L'expérience du CCFM a sans doute inspiré l'initiative de la TGIR Corpus et a servi de point de départ pour certaines activités de CAHIER (notamment pour l'organisation de groupes de travail et pour la rédaction de guides de bonnes pratiques).L'un des premiers groupes de travail de CAHIER visait à traiter les questions juridiques liées aux droits d'auteurs (et d'éditeurs) et à la mise à disposition de corpus. La BFM avait commencé comme un ensemble de concordanciers échangés dans un cadre privé entre chercheurs sous la forme de CD-ROM ou de tirages papier, puis elle avait progressivement ouvert l'accès à l'interrogation et au téléchargement du corpus sur Internet. Elle avait une longue histoire de relations complexes avec les éditeurs commerciaux. Denise Pierrot, qui s'est occupée des questions juridiques pour la BFM, a également joué un rôle important dans le groupe de travail correspondant de CAHIER et a contribué à la rédaction du Guide des bonnes pratiques. La situation juridique a évolué suite aux décisions de justice dans le procès Droz contre Garnier numérique (2014 et 2017), ce qui a rendu possible la mise à disposition libre de textes historiques (hors apparat critique).La pérennisation des données, grâce notamment à l'usage de l'encodage XML-TEI pour les textes et les annotations, a été la priorité pour la BFM depuis le début des années 2000 (Guillot et Heiden 2002). Le consortium CAHIER a pu bénéficier de la documentation de la BFM relative à l'encodage TEI du corps du texte et de l'entête (teiHeader) des documents. La BFM a été l'un des premiers projets à se conformer au modèle élaboré pour l'outil Weboai de CAHIER permettant le moissonnage des métadonnées (http://weboai.cahier.huma-num.fr). Toujours dans le domaine des métadonnées, les descripteurs typologiques de BFM, tels que le genre ou le domaine du texte, ont servi de base au thésaurus élaboré par le groupe de travail « Typologie textuelle » de CAHIER. Ce thésaurus, très riche et soigneusement structuré, permettra à son tour de préciser les métadonnées des futurs corpus de la BFM et de faciliter l'analyse de données de corpus agrégés à partir de plusieurs sources.La pérennisation des données de recherche conformément aux principes FAIR (Findability, Accessibility, Interoperability and Reusability) est l'activité du Consortium CAHIER fortement encouragée par la TGIR Huma-Num. Même si la vision qui semble se dégager des recommandations du conseil scientifique d'Huma-Num et qui consiste à exiger avant tout le dépôt des données dans l'outil Nakala nous paraît un peu réductrice, il est certain que l'archivage pérenne et l'accessibilité des données sont extrêmement importants. Le soutien que CAHIER assure pour le dépôt des textes et des images dans NAKALA est très précieux pour la BFM.La formation aux outils d'édition, d'analyse et de publication de corpus ouverts, ainsi que l'échange de bonnes pratiques éditoriales, a toujours été l'une des principales activités de CAHIER. La BFM, qui se développe en étroite collaboration avec la plateforme de préparation, d'analyse et de préparation de corpus TXM (Heiden et al. 2010) a pu partager son expérience, et des membres de l'équipe BFM ont animé de nombreuses séances de formation lors des ateliers CAHIER.Le consortium CAHIER a également favorisé les échanges entre l'équipe TXM et le Pôle document numérique de la MSH de Caen qui développe la chaîne éditoriale Métopes (grâce notamment au financement d'un stage en 2017). La BFM bénéficie actuellement de certains éléments de Métopes pour la mise en page de ses éditions au format PDF et des scripts de traitement automatique permettant d'importer dans TXM des documents XML-TEI créés avec Métopes ont été élaborés.La BFM est un projet qui a commencé bien avant la création du Consortium CAHIER et qui va sans doute continuer à se développer après la disparition de CAHIER dans sa forme actuelle de consortium de la TGIR Huma-Num. Quel que soit l'avenir du Consortium, nous sommes convaincus que les ressources numériques, les méthodes et les outils de travail élaborés grâce ou avec le soutien de CAHIER ainsi que les relations humaines et les partenariats de recherche qui se sont tissés au cours des dix ans de ses activités continueront à jouer un rôle important dans la communauté des humanités numériques.
- Published
- 2021
5. Enjeux philologiques, linguistiques et informatiques de la philologie numérique : l’exemple de la segmentation des mots
- Author
-
Lavrentiev, Alexei, Guillot, Céline, Heiden, Serge, Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA), Lavrentev, Alexey, École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), and Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Clermont Auvergne (UCA)
- Subjects
Philologie numérique ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,Segmentation lexicale ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,Diachronie du français - Abstract
International audience; Les linguistes travaillant sur l’histoire de la langue ont toujours exploité et utilisé comme principale source d’exploration les éditions « classiques », bien que depuis longtemps on connaisse leurs limites pour la recherche linguistique. Le développement des technologies modernes a d’un autre côté rendu le recours à de nouveaux outils (concordances, index, calculs statistiques) peu à peu indispensable à la recherche en langue, et plus récemment, les progrès continus de la technologie ont également permis d’envisager la réalisation d’éditions d’un nouveau type. L’édition numérique, qui a déjà donné lieu à plusieurs réalisations concrètes, a ainsi permis aux linguistes auparavant bridés par le papier et les techniques traditionnelles d’exprimer plus librement leurs besoins et leurs exigences. Plusieurs recherches récentes déjà publiées montrent l’efficacité de ce mouvement et le caractère novateur des acquis ainsi obtenus. A partir d’un exemple concret d’édition numérique interactive, notre présentation détaillera les enjeux méthodologiques liés à ces nouveaux outils et à ces nouvelles pratiques, en proposant une réflexion sur le concept de « philologie numérique » et en montrant ses principaux apports pour la recherche diachronique. Cette question sera illustrée en particulier par la question de la segmentation des mots.
- Published
- 2021
6. Storia di un ornitorinco : note sulla collaborazione in progetti di edizione scientifica digitale
- Author
-
Leclerc, Elise, Saïdi, Samantha, Laboratoire Universitaire Histoire Cultures Italie Europe (LUHCIE), Université Grenoble Alpes (UGA), Triangle : action, discours, pensée politique et économique (TRIANGLE), Centre National de la Recherche Scientifique (CNRS)-Sciences Po Lyon - Institut d'études politiques de Lyon (IEP Lyon), Université de Lyon-Université de Lyon-Université Jean Monnet [Saint-Étienne] (UJM)-Université Lumière - Lyon 2 (UL2)-École normale supérieure - Lyon (ENS Lyon), Paola Moreno, Hélène Miesse, Bárbara Bordalejo, Loredana Chines, Paola Italia, Pasquale Stoppelli, École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Sciences Po Lyon - Institut d'études politiques de Lyon (IEP Lyon), and Université de Lyon-Université de Lyon-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
filologia italiana ,Italie ,philologie ,edizione digitale ,filologia computazionale ,[SHS.LITT]Humanities and Social Sciences/Literature ,manuscrits ,Storia d'Italia -- Guicciardini ,Collazione ,The history of Italy -- Guicciardini ,manoscritti ,storia ,Italia ,[SHS.SCIPO]Humanities and Social Sciences/Political science ,[SHS.HISPHILSO]Humanities and Social Sciences/History, Philosophy and Sociology of Sciences ,Italy ,histoire ,Histoire d’Italie -- Guichardin ,digital humanities ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,philologie numérique - Abstract
Vol. 2019 paru en 2020; International audience; Les éditions scientifiques numériques ne sont plus une nouveauté dans le paysage scientifique international et leur prolifération a encouragé la communauté des chercheurs engagés dans leur production, à élaborer des normes et des réflexions théoriques sur les spécificités de ces éditions. Le contraste entre l'entreprise traditionnellement solitaire de la philologie et la dimension "naturellement" collaborative de la philologie numérique - due à la somme des compétences techniques et scientifiques requises pour produire de telles éditions - a souvent été souligné. Le présent article montrera que, dans la pratique, la publication d'une édition savante imprimée était déjà le résultat d'une collaboration entre chercheurs et éditeurs. On pourrait alors se demander si l'importance de ce contraste dans l'imaginaire reflète le relâchement des relations entre les premiers et les seconds, au point qu'ils n'aient plus été perçus comme de véritables collaborateurs? La dimension collaborative renouvelée de l'entreprise philologique dans l'environnement numérique apparaît donc comme l'un des nombreux défis méthodologiques, et un problème qui reste ouvert. Issus d'une expérience unique, et à certains égards singulière, les notes suivantes présentent, à travers le projet de l'édition numérique de l'exorde de la Storia d'Italia de Guicciardini, un exemple des opportunités et des succès d'un projet, mais aussi de ses limites.; Le edizioni scientifiche digitali (ESD) non sono più delle novità nel paesaggio scientifico internazionale, anzi: il loro moltiplicarsi ha contribuito a rafforzare la comunità di studiosi impegnati nella loro realizzazione, dando luogo sia all’elaborazione di standard ormai ben accettati sia a riflessioni teoriche sulle specificità di quelle edizioni. Si è spesso evidenziato il contrasto tra l’impresa tradizionalmente solitaria del filologo e la dimensione collaborativa ‘per natura’ della filologia digitale – dovuta alla somma di competenze tecniche e scientifiche richieste per realizzare tali edizioni. Se, in pratica, anche la pubblicazione di un’edizione scientifica cartacea è tuttora il frutto di una collaborazione, tra studiosi e case editrici, la pregnanza di quel contrasto nell’immaginario riflette forse l’allentarsi dei rapporti tra i primi e i secondi, tanto che non sono più percepiti come una collaborazione vera e propria. Comunque sia, la rinnovata dimensione collaborativa dell’impresa filologica in ambiente digitale appare come una tra le tante sfide metodologiche lanciate, e un problema tuttora aperto. Nate da una singola, e per alcuni versi singolare esperienza, quella dell'edizione digitale della Storia d'Italia de Guicciardini, le note che seguono presentano un esempio delle opportunità e dei successi di un progetto, ma anche dei suoi limiti, e vengono qui presentate nella speranza che le considerazioni che ne seguono siano di utilità per chi voglia iniziare un’impresa simile.
- Published
- 2020
- Full Text
- View/download PDF
7. Cohérence de l’alphabet meigretiste
- Author
-
Hsueh, Chia-Hung
- Subjects
Renaissance ,Typème ,Grammatologie ,Linguistique de corpus ,Philologie numérique ,Histoire de l’orthographe française ,Humanisme ,Histoire des théories linguistiques à la Renaissance française - Abstract
Cet article expose un parcours, le nôtre, dans lequel nous affrontons les problèmes soulevés par l’établissement de l’alphabet de Meigret ainsi que par la numérisation des ouvrages scripturaux du grammairien. La cohérence de cet alphabet et de son écriture est donc non seulement un constat à montrer, mais surtout un ensemble de dispositifs méthodologiques et technologiques à monter. Dans quelle mesure le système scriptural est-il développé dans une cohérence ?, This article outlines a path, our own, in which we confront the problems raised by the establishment of Meigret’s alphabet and the digitization of the grammarian’s scriptural works. The coherence of this alphabet and its writing is thus not only a statement to be shown, but above all a set of methodological and technological devices to be set up. To what extent is the scriptural system coherently developed ?
- Published
- 2020
- Full Text
- View/download PDF
8. Un modèle de reconnaissance automatique des entités nommées et des structures textuelles pour les corpus diplomatiques médiolatins
- Author
-
Torres Aguilar, Sergio, Dynamiques patrimoniales et culturelles (DYPAC), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Université Paris-Saclay, Pierre Chastang, and Xavier Tannier
- Subjects
Diplomatique ,Named entities recognition ,Digital philology ,Medieval history ,Reconnaissance des entités nommées ,Diplomatics ,Philologie numérique ,Medieval Latin ,Humanités numériques ,[SHS.HIST]Humanities and Social Sciences/History ,Histoire médiévale ,Latin TAL ,Digital humanities - Abstract
In this thesis, we present two computer models to structure textual information for large databases of medieval charters. The two models, one applied to the recognition of named entities, the other to the detection of parts of the diplomatics discourse, are supervised Conditional random fields (CRF) models trained on a hand-annotated corpus of medieval charters. ( orpus Burgundiae Medii Aevi or CBMA).The main Named Entity Recognition model has proven to be robust in its application to widely varying corpora in size, chronology and origin. The secondary model detecting parts of the diplomatic discourse, although less efficient, remains valid as a structuring tool. At the moment both can be used for indexing and studying a wide variety of diplomatics sources, thus saving huge human efforts.We have developed different solutions to overcome the gap between model's dependence on its original training-set and its ability to be applied to other corpora. Similarly, various corrections and additions were made to the golden-corpus from several historical and linguistic analysis concerning writing phenomena in charters, which greatly helped to improve the initial performance.In a later step we applied our automatic tools in the recognition of names of people, places and parts of the diplomatics discourse on thousands of charters from the CBMA corpus in order to study different questions concerning historical science and diplomatics. These studies concern the semi-automatic dating of a non-dated cartulary; the evolution of the spatial vocabulary in the charters of the central Middle Ages and the indexing of charters from their scriptural modules, in particular formulae of the charter protocols. This studies has a twofold purpose: on the one hand have shown different strategies for abstracting and adapting to the automatic processing well-known methods of research in history; on the other hand, seek to provide us tools with an applicative framework to obtain relevant knowledge to the historical science using massive processing.; Nous présentons dans cette thèse deux modèles informatiques développés pour délivrer de l'information structurée et applicables à de grandes bases de données de textes médiévaux. Les deux modèles, l'un appliqué à la reconnaissance des entités nommées, l'autre à la détection des parties du discours diplomatique, ont suivi un apprentissage supervisé utilisant la méthode des Champs aléatoires conditionnelles (CRF) sur un corpus manuellement annoté de actes médiévaux (Corpus Burgundiae Medii Aevi ou CBMA).Notre modèle principal de reconnaissance d'entités nommées a prouvé sa robustesse lorsqu'il a été appliqué sur des échantillons de corpus de taille, chronologie et origine très variés. Le modèle secondaire détectant les parties du discours diplomatique, bien que moins performant, s'est montré valide comme outil de structuration. Ils peuvent à présent être utilisés pour l'indexation et l’étude d’une grande variété de sources diplomatiques, économisant, ainsi des considérables efforts humains.Nous avons développé différentes solutions destinées à trouver un juste équilibre entre la dépendance du modèle à son corpus d'origine et sa capacité à être appliqué à d’autres corpus. De même, différents ajouts et corrections ont été opérés sur le corpus de référence à partir de plusieurs observations de type historique et linguistique concernant les documents utilisés, ce qui a permis d'améliorer la performance initiale.Nous avons ensuite appliqué les outils ainsi générés à la reconnaissance de noms de personnes, de lieux et de parties du discours diplomatique sur des milliers d'actes du CBMA afin d'étudier différentes questions intéressant la science historique et la diplomatique. Ces études concernent la datation semi-automatique d'un cartulaire qui en était dépourvu ; l'évolution du vocabulaire spatial dans les actes du Moyen Âge Central; et l'indexation des documents à partir des modules les intégrant, notamment les formules du protocole des actes. Par ces études nous poursuivons un double objectif: illustrer différentes stratégies permettant d'abstraire et d'adapter au traitement automatique des données des méthodes de recherche classiques en Histoire ; démontrer que nos outils de traitement massif permettent la génération de connaissances pertinentes pour la science historique.
- Published
- 2019
9. Un modèle de reconnaissance automatique des entités nommées et des structures textuelles pour les corpus diplomatiques médiolatins
- Author
-
Torres Aguilar, Sergio Octavio
- Subjects
Multidisciplinaire, généralités & autres [A99] [Arts & sciences humaines] ,Digital philology ,Diplomatics ,Medieval history ,Digital humanities ,Named entities recognition ,Medieval Latin ,Humanités numériques ,Reconnaissance des entités nommées ,Latin TAL ,Histoire médiévale ,Philologie numérique ,Diplomatique ,Multidisciplinary, general & others [A99] [Arts & humanities] - Published
- 2019
10. Les Carmina de Giovanni Pascoli : édition traduite et commentée d’une sélection de poèmes latins et édition numérique d’une sélectionde brouillons
- Author
-
Orsini, Sarah, Université Grenoble Alpes - UFR Langage, lettres et arts du spectacle, information et communication - Dpt Journalisme (UGA UFR LLASIC J ), Université Grenoble Alpes (UGA), Université Lumière - Lyon 2 (UL2), Histoire et Sources des Mondes antiques (HiSoMA), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Jean Monnet - Saint-Étienne (UJM)-Centre National de la Recherche Scientifique (CNRS), LITT&ARTS. Arts et pratiques du texte, de l’image, de l’écran et de la scène (LITT&ARTS), Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes (UGA), Université Lyon 2 Lumière, Università Roma Tre, Bruno Bureau, Giuseppe Leonelli, and Orsini, Sarah
- Subjects
Poesia Moderna ,Philology and paleography ,Filologia Classica ,[SHS.LITT]Humanities and Social Sciences/Literature ,Italian poetry ,Giovanni Pascoli ,Poetry 19-21th century - Supervielle - Saint-John Perse - Char - zoopoetics - exotism - alterity - literary genres - surrealism - lierature and science - literature and arts ,[SHS.LITT] Humanities and Social Sciences/Literature ,Ricezione ,Reception of Greco-Roman antiquity ,Classic literature ,Philologie numérique ,[SHS.CLASS]Humanities and Social Sciences/Classical studies ,Digital humanities ,Poesia italiana ,Poésie 19e siècle ,Neolatino ,Littérature italienne -- 19e siècle ,Réception antiquité ,Filologia computazionale ,Génétique de l’écriture ,Digital philology ,Genetic Edition ,Philologie classique ,[SHS.CLASS] Humanities and Social Sciences/Classical studies ,Littérature latine ,Humanités numériques ,Poesia latina ,Néo-latin ,Neo-latin poetry - Abstract
Giovanni Pascoli (1855-1912) is a classic of Italian literature. A bilingual poet writing in Italian and Latin. He has distinguished himself in the field of Neo-Latin literature by composing poems awarded in the certamen poeticum hoeufftianum. His Latin work, the Carminas, is almost unknown in France. The first objective of this doctoral research is to propose a bilingual edition, translated and commented, of a selection of Pascoli's Latin poems, accessible to a French audience not specialised in Latin or Italian literature. We have tried to select poems of various forms (narrative poems, epigrams, dedications odes) in order to give the reader an idea of what a complete edition of the Carmina could be like. In the introduction, we presented the biographical elements and the various aesthetic and linguistic aspects of Pascolian poetry that could facilitate the understanding of the texts. We also offer an analysis of the practice consisting in writing in Latin as a poetic experiment, and tried to situated this practice in relation to his contemporaries. We also tried as much as possible to study Pascoli's Latin poetry in relation to his Italian poetry. The second aspect of this thesis concerns the posthumous nature of this work, edited by the poet's sister, Maria Pascoli, with the help of philologist Ermenegildo Pistelli. Since the poet did not have time to propose a structure of his work in a collection, the Latin poems are organized according to thematic sections that are not always satisfactory (for example, the epigrams are published without organizational logic in a section containing all the short poems or the poems that could not be classified in the thematic sections). The digitization of all of G. Pascoli's drafts enabled us to explore the drafts of the author's plans, and we propose two possible collections in the introduction to this thesis: the first organized according to the chronology of the writing, the second organized according to the chronology of the facts represented. Our commented edition of the Carmina is presented according to the first organization, in order to offer an overview of Pascoli's writing as a process that has evolved over time. This study of the Pascholian writing process was also carried out at the poem level, in the detail of the composition. We made an XML-TEI genetic edition of a draft folder, that of the poem Crepereia Tryphaena. In this edition, we have described with great precision the writing gestures visible on the page (add, delete, substitute, move, rewrite a new version) and we have tried, when possible, to analyze the mental operations that caused these gestures. We have also tried to reconstruct the chronology of the writing of each draft, in order to create an editing prototype that allows us to read the drafts of poetry by displaying the text one writing campaign after the other and to visualize the modifications made by the author up to the scale of the letter. Thanks to this edition, we were able to analyse in detail the composition steps, the methods used by the author and the gestures made to carry out his project, and we deliver the results of this analysis at the end of the introduction of this thesis., Giovanni Pascoli (1855-1912) est un classique de la littérature italienne. Poète bilingue écrivant en italien et en latin, il s’est illustré dans le domaine de la littérature néo-latine en composant des poèmes qui ont remporté le certamen poeticum hoeufftianum. Son œuvre latine, les Carmina, est méconnue en France. Le premier objectif de cette recherche doctorale est de proposer une édition bilingue traduite et commentée d’une sélection des poèmes latins de Pascoli, accessible à un public français non spécialiste de littérature latine ou italienne. Nous avons tenté de sélectionner des poèmes de formes variées (poèmes narratifs, épigrammes, odes dédicatoires) afin de donner au lecteur un aperçu de ce que pourrait être une édition intégrale des Carmina. Nous avons présenté en introduction les éléments biographiques et les diverses aspects esthétiques et linguistiques de la poésie pascolienne susceptibles de faciliter la compréhension des textes. Nous y proposons également une analyse de l’expérience poétique que représente pour Pascoli le fait d’écrire en latin et de situer cette pratique par rapport à ses contemporains. Nous avons en outre essayé autant que possible d’étudier la poésie latine de Pascoli au contact de sa poésie italienne. Le second aspect de cette thèse porte sur le caractère posthume de cette œuvre, éditée par la sœur du poète, Maria Pascoli avec l’aide du philologue Ermenegildo Pistelli. Le poète n’ayant pas eu le temps de proposer une structuration de son œuvre en recueil, les poèmes latins sont organisés selon des sections thématiques qui ne sont pas toujours satisfaisantes (par exemple, les épigrammes sont éditées sans logique d’organisation dans une section rassemblant tous les poèmes de forme brève ou les poèmes qui n’ont pu être classés dans les sections thématiques). Grâce à la numérisation de l’ensemble des brouillons de G. Pascoli, nous avons pu explorer les ébauches de plans réalisés par l’auteur, et nous proposons dans l’introduction de cette thèse deux recueils possibles : le premier organisé selon la chronologie de l’écriture, le second organisé selon la chronologie des faits représentés. Notre édition commentée des Carmina est présentée selon la première organisation, afin d’offrir un aperçu de l’écriture de Pascoli comme un processus qui a évolué au fil du temps. Cette étude du processus de l’écriture pascolienne, nous l’avons également menée à l’échelle du poème, dans le détail de la composition. Nous avons réalisé une édition génétique XML-TEI d’un dossier de brouillons, celui du poème Crepereia Tryphaena. Dans cette édition, nous avons décrit avec une très grande précision les gestes d’écriture visibles sur la page (ajouter, supprimer, substituer, déplacer, réécrire une nouvelle version) et nous avons tenté, quand cela était possible d’analyser les opérations mentales qui ont provoqué ces gestes. Nous avons en outre tenté de reconstituer la chronologie de l’écriture de chaque brouillon, afin de créer un prototype d’édition qui permette de lire les brouillons de poésie en affichant le texte une campagne d’écriture après l’autre et de visualiser les modifications apportées par l’auteur jusqu’à l’échelle de la lettre. Grâce à cette édition, nous avons pu analyser dans le détail les étapes de composition, les méthodes employées par l’auteur et les gestes effectués pour mener à bien son projet, et nous livrons les résultats de cette analyse à la fin de l’introduction de cette thèse, Giovanni Pascoli (1855-1912) fa parte dei classici della letteratura italiana. Poeta bilingue scrivendo in italiano e in latino, è diventato famoso nell’ambito della letteratura neolatina per avere composto poemi premiati o lodati quasi ogni anno dal 1892 al certamenpoeticum hoeufftianum. La sua opera latina, i Carmina, è sconosciuta in Francia.Il primo obbiettivo di questa ricerca dottorale è di proporre un’edizione bilingue tradotta e commentata di una selezione dei poemi latini del Pascoli e di rendere quest’edizione accessibile a un lettorato francese che non sia specialista né di letteratura latina né di letteratura italiana. Abbiamo provato a selezionare poemi di forme varie (poemi narrativi, epigrammi, odi dedicatorie) per poter dare al lettore una visione d’insieme di quello che potrebbe essere un’edizione integrale dei Carmina. Abbiamo presentato in introduzioneelementi biografici e vari aspetti estectici e linguistici della poesia pascoliana suscettibili di agevolare la comprensione dei testi. Ci presentiamo anche un’analysi delle modalità della scrittura in latino come esperienza poetica, ambientando questa pratica nel contesto culturale in cui scriveva il Pascoli. Abbiamo inoltre provato a studiare la poesia latina del Pascoi al contatto di quella italiana.Il secondo aspetto di questa tesi riguarda il carattere postumo dei Carmina, la cui edizione princeps è stata realizzata da Maria Pascoli e Ermenegildo Pistelli. Il poeta non ha avuto il tempo di raggruppare i suoi poemi in una raccolta strutturata, quindi i Carmina sono stati organizzati in sezioni tematiche che non sono sempre soddisfacenti (per esempio, gli epigrammi sono pubblicati senza logica di organizzazione in una sezione ragruppando poemi di forma breve e poemi che non entravano nei temi delle sezioni). Grazie alla digitalizzazione dell’insieme delle carte di G. Pascoli, abbiamo potuto esplorare i tentativi di strutturazionedell’opera realizzati dal poeta, e proponiamo nell’introduzione di questa testi due strutture possibili : la prima secondo la cronologia della scrittura, e l’altra secondo la cronologia dei fatti rappresentati. Abbiamo scelto per presentare l’edizione commentata dei Carmina la prima struttura, per permettere di visualizzare la scrittura dei Carmina come un processo che ha evoluto nel tempo.Questo studio del processo della scrittura pascoliana, l’abbiamo anche portato al livello del poema, nel dettaglio della composizione. Abbiamo costituito un’edizione genetica XMLTEI di una cartella di carte, quella del poema Crepereia Tryphaena. In questa edizione, abbiamo descritto con una massima precisione possibile i gesti di scrittura visibili sulla pagina (aggiungere, cancellare, sostituire, spostare, riscrivere una nuova versione), e abbiamo tentato, quando era possibile, di analizzare le operazioni mentali che hanno provocato questi gesti. Inoltre, abbiamo provato a ricostituire la cronologia della scrittura di ogni carta, percreare un prototipo di edizione che permetta di leggere le carte di una poesia facendo apparire una stesura dopo l’altra, e permettendo di visualizzare le modifiche fino al livello della lettera. Grazie a quest’edizione abbiamo potuto analizzare precisamente le varie tappe della composizione di poesia, i metodi usati dall’autore et i gesti effettuati per condurre il suo progetto creativo. Presentiamo i risultati di quest’analisi alla fine dell’introduzione della tesi.
- Published
- 2019
11. Le positionnement éditorial dans l’édition critique numérique
- Author
-
Joana Casenave, Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication - ULR 4073 (GERIICO ), and Université de Lille
- Subjects
philologie ,édition numérique ,digital editing ,[SHS.INFO]Humanities and Social Sciences/Library and information sciences ,General Arts and Humanities ,Philosophy ,philology ,General Social Sciences ,Edition critique ,lcsh:History of scholarship and learning. The humanities ,Critical editing ,Critical edition ,lcsh:QA75.5-76.95 ,[SHS]Humanities and Social Sciences ,Computer Science Applications ,digital philology ,Digital humanities ,lcsh:AZ20-999 ,humanités numériques ,lcsh:Electronic computers. Computer science ,digital humanities ,Publication process ,Humanities ,philologie numérique ,Digital edition - Abstract
Critical editing is a practice whose contours have been well established by the philological tradition. The different critical conventions are well known and have been subject to a myriad of scientific studies. Nevertheless, critical edition has been undergoing changes since the development of new technologies. Digital critical editions have multiplied and today represent a large and varied panel. As a consequence, it’s worth observing, beyond technological innovations, what digital editing brings in terms of methodology and publishing conceptualisation. Obviously, in digital editions as in traditional editions, the final goal is offering readers a text that they will be able to consult and use in their research: the edited text should be a stable one, that can be an authoritative resource. The uniqueness of digital edition’s design, however, requires editors to reflect, right from the start of the publication process, on the information that they are going to provide, as well as on the way in which they will be presenting it. From the very beginning of its development, digital editing entails, then, a true awareness of how it will be received. It permits, also, a significant diversification of information presented in editions. It ultimately distinguishes itself with its open nature: digital editing is open in terms of content evolution over time just as it is in terms of collaborative editing. Résumé L’édition critique est une pratique dont les contours ont été bien établis par la tradition philologique. Les différents courants critiques sont bien connus et ont fait l’objet de nombreuses études scientifiques. Cependant, depuis le développement des nouvelles technologies, l’édition critique est en pleine mutation. Les éditions critiques numériques se sont multipliées et constituent aujourd’hui un panel large et varié. Dès lors, il importe d’observer, au-delà des innovations techniques, ce que l’édition numérique apporte en termes de méthodologie et de conceptualisation de l’édition. Bien évidemment, dans l’édition numérique comme dans l’édition traditionnelle, l’objectif final consiste à proposer au lecteur un texte qu’il va pouvoir consulter et utiliser dans ses recherches: le texte édité doit être un texte stable, qui puisse faire autorité. Cependant, la spécificité de conception des éditions numériques oblige les éditeurs à s’interroger, dès le début du processus d’édition, sur les informations qu’ils vont fournir, ainsi que sur la manière dont ils les présenteront. L’édition numérique implique alors, dès le début de son développement, une réelle prise en compte de la réception. Elle permet également une diversification importante des informations présentées dans l’édition. Elle se démarque enfin par son caractère ouvert: l’édition numérique est ouverte en termes d’évolution de contenu dans le temps tout comme en termes de collaboration au travail d’édition. Mots-clés: Edition critique; philologie; humanités numériques; édition numérique; philologie numérique
- Published
- 2019
- Full Text
- View/download PDF
12. Les catalogues et GROBID
- Author
-
Gabay, Simon, Khemakhem, Mohamed, Romary, Laurent, and Gabay, Simon
- Subjects
[SHS.LITT] Humanities and Social Sciences/Literature ,Catalogue of manuscripts ,GROBID-Dictionaries ,[INFO.INFO-CL] Computer Science [cs]/Computation and Language [cs.CL] ,Digital philology ,education ,Auctions and Markets ,Ventes aux enchères ,Catalogue de manuscrits ,Philologie numérique ,[INFO.INFO-HC] Computer Science [cs]/Human-Computer Interaction [cs.HC] ,[STAT.ML] Statistics [stat]/Machine Learning [stat.ML] ,TEI-XML - Published
- 2018
13. La transposition numérique de l'édition critique : éléments pour une édition de l'Isopet 1- Avionnet
- Author
-
Casenave, Joana, Marcoux, Yves, and Boivin, Jeanne-Marie
- Subjects
Critical Edition ,Critical Edition History ,Digital Humanities ,Digital Edition ,Fables ,Fables ésopiques ,Digital Philology ,Philologie numérique ,Edition critique ,Histoire de l'édition critique ,Humanités numériques ,Edition numérique - Abstract
Située au point de rencontre de la philologie et des sciences de l’information, cette thèse vise à analyser les développements les plus récents de l’édition critique. Compte tenu des transformations en cours dans la culture éditoriale, la méthode solidement établie de l’édition critique traditionnelle se trouve aujourd’hui confrontée à des questions d’ordre épistémologique tout à fait nouvelles. Les éditeurs doivent intégrer dans leur travail et leurs méthodes éditoriales les transformations consécutives à l’essor des techniques informatiques. C'est précisément la question de la transposition numérique de l'édition critique qui est abordée ici. Nous souhaitons interroger cette notion, qui nous paraît centrale, de la continuité entre les deux domaines – celui de l’édition traditionnelle et celui de l’édition numérique. Dans une première partie consacrée à l’édition critique traditionnelle, après un rappel historique et méthodologique qui nous permet de replacer l’édition critique dans son contexte culturel spécifique, nous étudions les modalités de traitement de l’édition critique et analysons la démarche éditoriale du philologue. L’édition critique n’est généralement pas réductible à une simple pratique mais est sous-tendue par un ensemble conceptuel complexe. Dans une deuxième partie consacrée à l’édition critique numérique, nous étudions l'évolution que connaissent les concepts philologiques lors du passage au numérique et nous évaluons les possibilités techniques nouvelles apportées dans ce domaine par l'informatique. Ces questions, qui portent aussi bien sur la méthode de l'édition critique que sur la réception de l'œuvre éditée, sont au cœur de notre recherche. Nous accompagnons notre réflexion théorique d'un travail pratique d'édition critique réalisé sur un échantillon de fables médiévales issues de l'Isopet 1-Avionnet, que nous présentons dans la troisième partie de notre thèse., At the crossroads of philology and information sciences, this thesis aims at analyzing the most recent developments in critical edition. In view of the transformations currently taking place in editorial culture, the solidly established method of traditional critical edition is today confronted to new epistemological questions. Editors must now integrate into their work–and work methods–changes brought about by computer technology. This is precisely the question of the digital transposition of critical edition investigated here. We wish to ponder on the notion, which seems central to us, of the continuity between the domains of traditional edition and of digital edition. The first part of the thesis, dedicated to traditional critical edition, begins with a historical and methodological overview that allows us to position critical edition in its specific cultural context. We then analyze the information processing modes of critical edition and the editorial methods of philologists. Critical edition is generally not reducible to a single and simple practice, but is rather underpinned by a complex conceptual structure. The second part of the thesis is dedicated to digital critical edition. We first look at how philological concepts evolve in the passage from traditional to digital edition. Then we assess the new technical possibilities opened up in the domain by computer technology. These questions, pertaining as much to the method of critical edition as to the reception of the edited work, are at the heart of our research. We accompany our theoretical investigations with a practical part, presented in the third part of the thesis, consisting in the critical edition of a sample of fables taken from Isopet 1-Avionnet. Finally, the conclusion of our work includes the elements to be considered in the development of a theoretical model of digital critical edition., Thèse de doctorat réalisée en cotutelle avec l'Université Paris-Est Créteil (France).
- Published
- 2017
14. Jean-Baptiste Camps, La Chanson d’Otinel. Édition complète du corpus manuscrit et prolégomènes à l’édition critique
- Author
-
Camps, Jean-Baptiste
- Subjects
édition numérique ,philologie ,réception ,digital editing ,text history ,ecdotique ,epic ,traduction médiévale ,ecdotics ,computational methods ,digital philology ,codicologie ,scriptologie ,humanités numériques ,chanson de geste ,histoire des textes ,paléographie ,reception ,philology ,codicology ,stemmatology ,stemmatologie ,medieval translation ,linguistique computationelle ,ComputingMethodologies_DOCUMENTANDTEXTPROCESSING ,scriptology ,palaeography ,digital humanities ,philologie numérique - Abstract
The Chanson d’Otinel : Complete Edition of the Manuscript Corpus and Prolegomena to a Critical Edition. Part of the geste du roi, the Chanson d’Otinel had not been the subject of an edition since the pioneer work of F. Guessard and H. Michelant in 1858. Starting with the tangible objects that manuscripts are, and proceeding to the study of the tradition and work itself, this study aims to provide a new examination of all the available data, in order to enable a restoration of a song that has know an important diffusion in Medieval Europe, but whose scattered remains only are available to us.This study is given a firmly methodological orientation, and searches to apply to the edition the epistemological progresses brought by recent contributions in the field of textual criticism and ecdotics, as well as by what is now called “Digital Humanities”. It aims at overcoming the debate between “New” and Traditional Philology, based on the common errors method or of Bedierist inspiration, to place itself in the perspective of a “Fourth Way” and of an edition “oriented towards the tradition”.Digital scholarly editing and Digital Philology techniques are used in order to provide a full edition of the manuscript corpus, with “layered” transcriptions that give access to different representations and to the graphic system of all witnesses. The edition aims also at the study and description of the links between these witnesses, by suggesting a method of representation of textual variance and by rooting genealogical analysis in a global consideration of the tradition, including medieval translations (in Welsh, Norse, English) and derived versions.The modelling and description of manuscripts and their texts – formalised by an xml/tei model conceived for this edition but seeking to be of more general interest – is clearly oriented towards data mining, and computational as well as traditional analysis (Palaeography, Scriptometry, Stemmatology). Methods from the fields of mathematical modelling, statistics, algorithmic, and artificial intelligence are put to use, as well as processes seeking to allow interoperability, scalability, and systematisation of editorial work (optical character recognition, linguistic tagging, collation), in a workflow centred on analysis. Main used languages are xml (tei, xslt), r and Python.
- Published
- 2017
15. A glossary for Mme de Sévigné
- Author
-
Gabay, Simon, Gabay, Simon, and Université de Neuchâtel (UNINE)
- Subjects
Sévigné ,XVIIe siècle français ,[SHS.LITT] Humanities and Social Sciences/Literature ,Lexicography ,[SHS.LITT]Humanities and Social Sciences/Literature ,17th-century France ,Digital philology ,Lexicograhie ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,Philologie numérique ,Glossaire ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,Glossary - Abstract
International audience; Comment construire un glossaire pour la correspondance de Mme de Sévigné, tenant compte des archaïsmes et des modernismes? Quelles ressources lexicographiques anciennes et contemporaines? Comment encoder ce glossaire en XML-TEI?
- Published
- 2017
16. La ' philologie numérique ' : tentative de définition d'un nouvel objet éditorial
- Author
-
Céline Guillot, Alexei Lavrentiev, Thomas Rainsford, Christiane Marchello-Nizia, Serge Heiden, Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Lumière - Lyon 2 (UL2)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-École normale supérieure - Lyon (ENS Lyon)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020]), University of Oxford [Oxford], Interactions, Corpus, Apprentissages, Représentations (ICAR), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS), Richard Trachsler, Frédéric Duval, Lino Leonardi, Les auteurs remercient le LABEX ASLAN (ANR-10-LABX-0081) de l'Université de Lyon pour son soutien financier dans le cadre du programme 'Investissements d'Avenir' (ANR-11-IDEX-0007) de l'Etat Français géré par l'Agence Nationale de la Recherche (ANR)., École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), University of Oxford, and École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
français médiéval ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,philologie numérique ,diachronie - Abstract
Les linguistes travaillant sur l'histoire du français ont toujours basé leurs travaux de recherche sur des éditions scientifiques de textes anciens. Depuis bon nombre d'années, le développement de la linguistique de corpus et de ses méthodes empiriques a par ailleurs favorisé la constitution de grandes bases de données largement diffusées. Les besoins et les exigences des linguistes ont donc évolué et se sont progressivement accrus au fur et à mesure que le développement des technologies modernes rendait le recours à de nouveaux outils (concordances, index, calculs statistiques) indispensable à la recherche basée sur corpus et offrait d'une part des possibilités d'enrichissement des textes inédites jusque là (étiquetage morphologique, parsage syntaxique, etc.), d'autre part des possibilités étendues d'accès critique au texte de base (navigation entre niveaux de transcription suivant l'objet linguistique étudié, lecture synoptique de facsimilés et de transcriptions, etc.). Plus récemment, les progrès continus de la technologie ont également permis d'envisager la réalisation d'éditions d'un nouveau type. Les éditions numériques de textes anciens, de plus en plus nombreuses depuis les années 1990, ont permis d'explorer les nouvelles potentialités offertes par les outils informatiques et ont parallèlement mené au développement de nouvelles pratiques éditoriales. Le numérique a ainsi conduit les philologues éditeurs de textes à repenser et à redéfinir des pratiques qui pouvaient, par ailleurs, sembler relativement hétérogènes et diverses (Duval 2006). Le moment semble donc venu d'adopter une attitude réflexive à l'égard de l'ensemble de ces recherches et de mener une réflexion théorique et méthodologique dans le but de mieux définir ce que sont l'édition numérique, ses enjeux, ses principes et ses méthodes. La pratique et la théorisation de la philologie numérique ('digital philology') ont déjà fait l'objet de plusieurs publications majeures essentiellement anglophones (par exemple Burnard & al. 2006 et Ciula & al. 2006), sans parler de nombreux articles de la revue Literary and Linguistic Computing et de communications au colloque annuel Digital Humanities. Les publications sont nettement moins nombreuses dans le domaine de la philologie romane. Par ailleurs, les relations entre la philologie numérique et la philologie traditionnelle sont encore loin d'être définies et de nombreuses éditions continuent à être produites " à l'ancienne " (même si depuis plusieurs décennies toute édition passe par le médium électronique lors de sa production). Cette situation est dûe en partie au manque de consignes claires quant à la production d'une édition numérique, à l'absence d'un cadre de description précis des multiples usages qui peuvent en être fait au-delà de la simple lecture et de critères solides pour leur évaluation. En nous fondant sur notre expérience et sur l'Édition numérique interactive de la Queste del saint Graal (http://txm.bfm-corpus.org/txm), notre communication proposera une tentative de définition d'un objet éditorial d'un genre partiellement nouveau, dont nous aborderons les principales composantes : - l'étude de la tradition manuscrite et la procédure de choix du/des manuscrit(s) ; - l'apparat critique (introduction, notes, glossaire, index, recherches linguistiques, etc.) et la place de la traduction en langue moderne ; - l'établissement du texte : les types de transcription (plus ou moins diplomatique, plus ou moins normalisée), les possibilités de choix multiples à travers différentes facettes permettant une navigation interactive ; - les outils et les stratégies d'interrogation et de recherche ; - les modes et conditions de diffusion et les publics visés. Ce faisant, notre exposé détaillera les principaux enjeux méthodologiques et scientifiques liés aux outils numériques et aux pratiques éditoriales émergentes, en proposant une réflexion sur le concept de " philologie numérique ", et en montrant, à partir d'exemples de recherche concrets, ses principaux apports pour la recherche philologique et linguistique - mais aussi littéraire ou historique. Nous espérons que cette réflexion contribuera à promouvoir de nouvelles pratiques éditoriales qui allient la qualité du travail philologique à la facilité d'accès et d'usage pour différentes catégories d'utilisateurs.
- Published
- 2017
17. The Chanson d’Otinel : Complete Edition of the Manuscript Corpus and Prolegomena to a Critical Edition
- Author
-
Jean-Baptiste Camps, Études et édition de textes médiévaux (EETM), Université Paris-Sorbonne (UP4), Université Paris-Sorbonne - Paris IV, Dominique Boutet, and Camps, Jean-Baptiste
- Subjects
édition électronique ,philologie romane ,littérature médiévale ,[SHS.LITT]Humanities and Social Sciences/Literature ,Medieval Literature ,Digital Editing ,chanson d'Otinel ,Text History ,ecdotique ,[SHS.LITT] Humanities and Social Sciences/Literature ,Digital Humanities ,codicologie ,Ecdotics ,scriptologie ,humanités numériques ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,chanson de geste ,histoire des textes ,paléographie ,Circulation and Reception of oïl Literature ,circulation et réception de la littérature d'oïl ,Scriptology ,Romance Philology ,Digital Philology ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,Palaeography ,stemmatologie ,Stemmatology ,traductions médiévales ,[SHS.HIST] Humanities and Social Sciences/History ,Codicology ,Medieval Translations ,méthodes quantitatives ,[SHS.HIST]Humanities and Social Sciences/History ,philologie numérique ,Computational Methods - Abstract
Part of the geste du roi, the Chanson d'Otinel had not been the subject of an edition since the pioneer work of F. Guessard and H. Michelant in 1858. Starting with the tangible objects that manuscripts are, and proceeding to the study of the tradition and work itself, this study aims to provide a new examination of all the available data, in order to enable a restoration of a song that has know an important diffusion in Medieval Europe, but whose scattered remains only are available to us.This study is given a firmly methodological orientation, and searches to apply to the edition the epistemological progresses brought by recent contributions in the field of textual criticism and ecdotics, as well as by what is now called “Digital Humanities”. It aims at overcoming the debate between “New” and Traditional Philology, based on the common errors method or of Bedierist inspiration, to place itself in the perspective of a “Fourth Way” and of an edition “oriented towards the tradition”.Digital scholarly editing and Digital Philology techniques are used in order to provide a full edition of the manuscript corpus, with “layered” transcriptions that give access to different representations and to the graphic system of all witnesses. The edition aims also at the study and description of the links between these witnesses, by suggesting a method of representation of textual variance and by rooting genealogical analysis in a global consideration of the tradition, including medieval translations (in Welsh, Norse, English) and derived versions.The modelling and description of manuscripts and their texts – formalised by an xml/tei model conceived for this edition but seeking to be of more general interest – is clearly oriented towards data mining, and computational as well as traditional analysis (Palaeography, Scriptometry, Stemmatology). Methods from the fields of mathematical modelling, statistics, algorithmic, and artificial intelligence are put to use, as well as processes seeking to allow interoperability, scalability, and systematisation of editorial work (optical character recognition, linguistic tagging, collation), in a workflow centred on analysis. Main used languages are xml (tei, xslt), r and Python., Se rattachant à la geste du roi, la Chanson d'Otinel n'avait pas été rééditée depuis le travail pionnier de F. Guessard et H. Michelant en 1858. Partant des objets tangibles que sont les manuscrits pour aller vers l'étude de la tradition et de l'œuvre, ce travail se propose de réexaminer l'ensemble des données disponibles, en vue de permettre la restauration d'une œuvre qui a connu une diffusion importante dans l'Europe médiévale, mais que nous ne conservons qu'en l'état de vestiges épars.La thèse prend un parti résolument méthodologique, en cherchant à faire bénéficier l'édition des progrès épistémologiques engendrés tant par les contributions les plus récentes aux débats propres à l'ecdotique et à la critique textuelle que par ce qu'il est convenu d'appeler les « humanités numériques ». L'édition tente ainsi de dépasser l'opposition entre philologie « nouvelle » et traditionnelle, de la méthode des fautes communes ou d'inspiration bédiériste, pour se placer dans la perspective d'une « quatrième voie » et d'une édition « tournée vers la tradition ».Les techniques de l'édition électronique et de la philologie numérique sont sollicitées afin de fournir une édition complète du corpus manuscrit, qui, par des transcriptions « à couches », donne accès à différentes représentations et au système graphique des différents témoins. L'édition vise également à la description et l'analyse des liens que ces témoins entretiennent entre eux, en mettant en place une méthode de représentation de la variance textuelle et en cherchant à appuyer l'analyse généalogique sur une prise en compte globale de la tradition, incluant les traductions médiévales (galloises, norroises, anglaises) et les versions dérivées.Le travail de modélisation et de description des manuscrits et de leurs textes, formalisé par un modèle xml/tei conçu pour les besoins de cette édition mais se voulant de portée plus générale, est très nettement tourné vers l'exploitation des données, dans une perspective d'analyse quantitative doublée d'une approche plus traditionnelle (paléographie, scriptométrie, stemmatologie). Des méthodes relevant de la modélisation mathématique, de la statistique, de l'algorithmique et de l'intelligence artificielle sont mises en œuvre, ainsi que des traitements visant à permettre l'interopérabilité, la montée en masse et la systématisation du travail éditorial (reconnaissance optique de caractères, annotation linguistique, collation), au sein d'une chaîne éditoriale faisant la part belle à l'analyse. Les développements effectués sont principalement en xml (tei, xslt), r et Python.
- Published
- 2016
18. Philologie et herméneutique numériques
- Author
-
Mayaffre, Damon, Pincemin, Bénédicte, Valette, Mathieu, Viprey, Jean-Marie, BCL, équipe Logométrie : corpus, traitements, modèles, Bases, Corpus, Langage (UMR 7320 - UCA / CNRS) (BCL), Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Université Côte d'Azur (UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA), Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet [Saint-Étienne] (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), Équipe de Recherche en Textes, Informatique, Multilinguisme (ERTIM), Institut National des Langues et Civilisations Orientales (Inalco), Centre Jacques-Petit - Archives, Textes et Science des Textes (ATST), Université de Franche-Comté (UFC), Université Bourgogne Franche-Comté [COMUE] (UBFC)-Université Bourgogne Franche-Comté [COMUE] (UBFC), Franck Neveu, Les auteurs remercient le LABEX ASLAN (ANR-10-LABX-0081) de l'Université de Lyon pour son soutien financier dans le cadre du programme 'Investissements d'Avenir' (ANR-11-IDEX-0007) de l'Etat Français géré par l'Agence Nationale de la Recherche (ANR)., Mayaffre, Damon, Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA), École normale supérieure de Lyon (ENS de Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université de Lyon-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-Université Jean Monnet - Saint-Étienne (UJM)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])-Centre National de la Recherche Scientifique (CNRS), Université Jean Moulin - Lyon 3 (UJML), and Université de Lyon-Université de Lyon-Université Lumière - Lyon 2 (UL2)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS)-Université Blaise Pascal - Clermont-Ferrand 2 (UBP)-École normale supérieure - Lyon (ENS Lyon)-Université Clermont Auvergne [2017-2020] (UCA [2017-2020])
- Subjects
logométrie ,format de texte ,[SHS.STAT]Humanities and Social Sciences/Methods and statistics ,textométrie ,[SHS.STAT] Humanities and Social Sciences/Methods and statistics ,document numérique ,analyse de données textuelles ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,herméneutique numérique ,[SHS.LANGUE] Humanities and Social Sciences/Linguistics ,philologie numérique - Abstract
International audience; La place croissante du numérique dans les pratiques langagières, textuelles et discursives, et le développement des données, ressources et outils numériques interrogent fondamentalement le linguiste.L'échange proposé s'ancrera plus spécifiquement dans le terrain de la linguistique textuelle et de l'analyse du discours, et décrira les modifications que le numérique implique dans la production et la circulation des textes et des discours, ainsi que dans les modalités de leur analyse et interprétation linguistiques. Ces modifications se situent à plusieurs niveaux.Modifications des formes langagières, textuelles et discursivesLa production verbale en contexte numérique (en ligne ou hors ligne) implique des modifications dans les formes langagières elles-mêmes (sur les plans graphique, morphographique, technomorphographique notamment) ; dans les formes phrastiques et discursives en production comme en réception (délinéarisation hypertextuelle par exemple, qui implique un énoncé de geste de la part du scripteur comme du lecteur) ;dans les dispositifs énonciatifs (locuteurs augmentés et collectifs, modification de la notion d'auteur) ;dans les genres textuels et discursifs (technogenres natifs de l'internet) ; dans le rapport entre écriture et lecture (phénomène d'écrilecture) ; ou dans la nature même des énoncés qui présentent une hybridité sémiotique inédite (éléments langagiers couplés à des éléments iconiques fixes ou animés, et/ou sonores).Modification du rapport aux données langagières, textuelles et discursivesPour le chercheur, le numérique modifie également le rapport à la langue et aux données linguistiques, aux textes et aux discours. Jusqu'à quel point le numérique modifie-t-il le mode de constitution de nos objets, de nos corpus, de nos observables ? A partir de leur expérience, les intervenants témoigneront de ce que la pratique numérique révèle de l'établissement des textes, de leur représentation et de leur analyse. Si le transfert massif des ressources papier vers des ressources numériques interroge, à un premier niveau, en donnant la possibilité de transformer le texte en un texte augmenté ou en un hypertexte doté de sa réticularité, le caractère nativement numérique de la plupart des documents contemporains questionne aujourd’hui le linguiste, à un deuxième niveau, en proposant de nouveaux observables pour de nouveaux parcours analytiques et interprétatifs.Modification de la circulation des productions nativesLes textes et discours circulent dans les environnements numériques natifs de manière inédite : leur investigabilité (searchability), la possibilité de leur redocumentarisation (passage d'un ensemble de traces éparses à un document via des outils de curation ou redocumentarisation) mais aussi leur imprévisibilité discursive (la captation des traces par les algorithmes producteurs apparemment autonomes de discours) les inscrivent dans une mémoire numérique explicite et quantifiable, différents des dispositifs interprétatifs et de reconnaissance culturelles qui structurent la compréhension d'un texte imprimé dans un contexte hors ligne. Enfin, dans les écosystèmes numériques natifs (du web 2.0), tout énoncé est fondamentalement et techniquement relationnel, ce qui ajoute une dimension supplémentaire et questionne par ailleurs la notion devenue évidente et nécessaire de dialogisme.Modifications théoriques et méthodologiques de la linguistiquePar conséquent, aux plans théoriques et méthodologiques, nous sommes amenés à problématiser l'incidence du numérique sur la démarche linguistique : ses questionnements, ses objectifs, ses méthodes. Comment la description de la langue peut-elle s'articuler avec les attestations qui gisent dans les immenses bases de données issues d'internet ? Les corpus apportent à la fois une relativisation des résultats qu'il faut accommoder avec la visée scientifique généralisante, et une quantification qui ouvre une nouvelle dimension à la description linguistique, passant du possible / impossible à un continuum de probabilités. Plus spécifiquement, pour la linguistique textuelle et l’analyse du discours, « l’archive universelle », « l’horizon d’attente » et la notion cardinale d’« intertextualité » ne sont-ils pas révolutionnés par la disponibilité et l’accessibilité d’une archive numérique immense et à chaque instant démultipliée ? Jusqu'à quel point le numérique change-t-il nos points de vue, c'est-à-dire nos lieux d'observation, sur la langue et les discours ? Inversement, l'approche numérique pourrait induire certains angles morts, à identifier et discuter, comme peut-être le "silence" des formes non attestées, ou l'occultation des cas singuliers par les phénomènes massifs.
- Published
- 2016
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.