182 results on '"Börner, Ingo"'
Search Results
2. CLS INFRA D5.2 Case Studies in Data Preparation and Sharing
- Author
-
Mrugalski, Michał, Blietz, Annika, Börner, Ingo, Bauer, Elisabeth, Charvat, Vera, Ďurčo, Matej, Laszakovits, Sabine, and Resch, Stefan
- Subjects
data lanscape, literary text collections, corpus architecture, topology of corpora, FAIR principles, surprisal - Abstract
This deliverable presents three case studies involving digitisation and transformation processes; the studies are presented in order of the complexity of the research question, which is reflected in the difficulty of the corpus compilation task. Transformation processes seem to be inevitable in each case, but paradoxically the urgency of digitisation diminishes as the complexity of a task increases, The case studies described in this deliverable are: 1. Creation of an ELTeC affine corpus of the Slovak novel (chapter 2) 2. Finding the haiku across multilingual corpora (chapter 3) 3. Measuring entropy and surprisal in the prose of the Tsarist Empire Devoted to Terrorism (Russian and Polish Texts) (chapter 4) The first two case studies have already served as reference cases for the data landscape review (CLS INFRA Deliverable 5.1). This extended version, which conveys the experience of six months of research and is enriched by the third case study, highlights specific aspects of the multidimensional landscape of literary text collections. In Deliverable 5.1, they were merely illustrations and concretisations of general points; now they are the focus of attention. The third case has been designed with the most complex research questions in mind, to go even further in exploring what is available and what is possible in the digital humanities today.
- Published
- 2023
- Full Text
- View/download PDF
3. Computational Literary Studies Infrastructure (CLS INFRA): Initial Findings and Conclusions for the Field
- Author
-
Birkholz, Julie M., Börner, Ingo, Byszuk, Joanna, Chambers, Sally, Charvat, Vera Maria, Cinková, Silvie, Dejaeghere, Tess, Dudar, Julia, Ďurčo, Matej, Eder, Maciej, Edmond, Jennifer, Fileva, Evgeniia, Fischer, Frank, Garnett, Vicky, Heiden, Serge, Křen, Michal, Kunda, Bartłomiej, Laszakovits, Sabine, Mrugalski, Michał, Papaki, Eliza, Raciti, Marco, Resch, Stefan, Ros, Salvador, Schöch, Christof, Šeļa, Artjoms, Tasovac, Toma, Tonra, Justin, Tóth-Czifra, Erzsébet, Trilcke, Peer, van Dalen-Oskam, Karina, van Rossum, Lisanne, Scholger, Walter, Vogeler, Georg, Tasovac, Toma, Baillot, Anne, Raunig, Elisabeth, Scholger, Martina, Steiner, Elisabeth, Centre for Information Modelling, and Helling, Patrick
- Subjects
Paper ,and methods ,Informatics ,and ethics analysis ,CLS ,computational literary studies ,public humanities collaborations and methods ,digital access ,Linguistics ,Cultural studies ,research infrastructures ,privacy ,data publishing projects ,Literary studies ,text mining and analysis ,FOS: Languages and literature ,systems ,Poster - Abstract
The aim of this poster is to provide an overview of the work carried out in the CLS INFRA project and its conclusions for the field of Computational Literary Studies.
- Published
- 2023
- Full Text
- View/download PDF
4. Distributed Corpus Building in Literary Studies: The DraCor Example
- Author
-
Giovannini, Luca, Skorinkin, Daniil, Trilcke, Peer, Börner, Ingo, Fischer, Frank, Dudar, Julia, Milling, Carsten, Pořízka, Petr, Scholger, Walter, Vogeler, Georg, Tasovac, Toma, Baillot, Anne, Raunig, Elisabeth, Scholger, Martina, Steiner, Elisabeth, Centre for Information Modelling, and Helling, Patrick
- Subjects
Paper ,Performance Studies: Dance ,DraCor ,TEI ,collaboration ,Literary studies ,text encoding and markup language creation ,deployment ,crowdsourcing ,digital research infrastructures development and analysis ,drama ,Poster ,corpus-building ,and analysis ,Theatre - Abstract
The multilingual DraCor platform (https://www.dracor.org) represents a valuable resource for literature and theatre scholars, allowing them to host, access and analyse thousands of plays from Antiquity to the XX century. After briefly presenting the workflow for the ingestion of new plays into our ecosystem, we focus on the collaborative side of our endeavours, demonstrating how external scholars can benefit from a range of tools and guides to easily prepare and submit their own collections. As a showcase of the process, we present three corpora currently in production, focusing respectively on Ukrainian, Czech, and Early Modern English literature.
- Published
- 2023
- Full Text
- View/download PDF
5. Intertextuality in the Legal Papers of Karl Kraus: A Scholarly Digital Edition
- Author
-
Bleier, Roman, Klug W., Helmut, Börner, Ingo, Hannesschläger, Vanessa, Langkabel, Isabel, Prager, Katharina, Bleier, Roman, Klug W., Helmut, Börner, Ingo, Hannesschläger, Vanessa, Langkabel, Isabel, and Prager, Katharina
- Abstract
Projektbericht
- Published
- 2023
6. Arthur Schnitzler — Kritische Edition (Frühwerk) III
- Author
-
Bleier, Roman, Klug W., Helmut, Fliedl, Constanze, Börner, Ingo, Lindner, Anna, Rauchenbacher, Marina, Schwentner, Isabella, Bleier, Roman, Klug W., Helmut, Fliedl, Constanze, Börner, Ingo, Lindner, Anna, Rauchenbacher, Marina, and Schwentner, Isabella
- Abstract
Projektbericht
- Published
- 2023
7. Onboard onto DraCor. Prototyping Workflows to Homogenize Drama Corpora for an Open Infrastructure
- Author
-
Börner, Ingo, Fischer, Frank, Giovannini, Luca, Lu, Christopher, Milling, Carsten, Skorinkin, Daniil, Sluyter-Gäthje, Henny, Trilcke, Peer, Trilcke, Peer, Busch, Anna, Helling, Patrick, Plum, Alistair, Wolter, Vivien, Weis, Joëlle, and Chudoba, Hendrik
- Subjects
Community-Bildung ,Annotieren ,Bearbeitung ,corpus ,onboarding ,DHd2023 ,drama ,Literatur ,Kollaboration ,Text - Abstract
The process of onboarding new texts onto already established platforms, such as the Drama Corpora (DraCor) ecosystem, poses several challenges in terms of data curation and homogenization. We present here for discussion the prototypes of some pipelines, workflows, and tools embedding plays from diverse sources and formats into the DraCor environment. As a showcase of our approach, we also report on the building process of two new corpora (the English-language EPDraCor and the Ukrainian UDraCor), whose different sources require a flexible and tailored approach. Ein Beitrag zur 9. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2023 Open Humanities Open Culture.
- Published
- 2023
- Full Text
- View/download PDF
8. CLS INFRA D8.1 Report of the tools for the basic Natural Language Processing (NLP) tasks in the CLS context
- Author
-
Cinková, Silvie, Birkholz, Julie M., Börner, Ingo, Dejaeghere, Tess, Heiden, Serge, Janssen, Maarten, Křen, Michal, and Pozo, Alvaro Perez
- Subjects
Parsing ,Infrastructure ,Text Mining ,CLS ,Annotation ,DH ,Text search ,Corpus ,NLP ,Computational Literary Studies ,Digital Humanities ,Tools ,Tagging ,Multilingual ,Named-Entity Recognitiion ,Information Extraction - Abstract
This report lists and describes a selection of Natural Language Processing (NLP) tools which are considered to form a Corpus-Enrichment and NLP toolchain for common CLS research tasks. The tools were selected to be: • safely positioned in their life cycle, i.e., state-of-the art, and mature as well as continuously maintained, or in development and promised as CLS Infra Deliverables by March 2025 • as multilingual as possible (beyond English and several major European languages) • as interoperable as possible with other tools and texts in other languages.
- Published
- 2023
- Full Text
- View/download PDF
9. CLS INFRA D7.1 On Programmable Corpora
- Author
-
Börner, Ingo, Trilcke, Peer, Fischer, Frank, Milling, Carsten, Göbel, Mathias, Schwindt, Mark, Skorinkin, Daniil, and Sluyter-Gäthje, Henny
- Subjects
Corpora ,Literature ,API ,DraCor ,Programmable Corpora ,Computational Literary Studies - Abstract
While the discipline of Computational Literary Studies (CLS) consolidates, infrastructural challenges arise that have to be addressed to ensure that good, sustainable and open scholarship can be carried out in this dynamic field of Digital Humanities research. In this situation, Work Package 7 of the CLS project, entitled “Building the Ecosystem of and for Programmable Corpora”, is developing a small-scale, but highly functional prototype for an infrastructural ecosystem for CLS research, following the concept of a network-based software architecture. The prototype, implemented as the multi-component system “DraCor” (Drama Corpora Platform), realizes the concept of “Programmable Corpora”, which is defined as corpora that expose an open, transparently documented and (at least partly) research-driven API to make texts machine-actionable. This report gives a detailed description of the DraCor system as a prototype for “Programmable Corpora”. It also shares two first experiments in adapting and transferring the approach of an API-based CLS research infrastructure to other systems and resources.
- Published
- 2023
- Full Text
- View/download PDF
10. Arthur Schnitzler — Kritische Edition (Frühwerk) III
- Author
-
Fliedl, Constanze, Börner, Ingo, Lindner, Anna, Rauchenbacher, Marina, Schwentner, Isabella, Bleier, Roman, and Klug W., Helmut
- Subjects
ddc:020 ,ddc:000 ,ddc:004 - Abstract
Projektbericht
- Published
- 2023
11. Einführung in DraCor - Programmable Corpora für die digitale Dramenanalyse
- Author
-
Börner, Ingo, Fischer, Frank, Milling, Carsten, Sluyter-Gäthje, Henny, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Community-Bildung ,Einführung ,API ,Linked Data ,Dramenanalyse ,Infrastruktur ,Netzwerkanalyse ,DHd2022 ,Stilistische Analyse ,Literatur ,Digitale Literaturwissenschaft - Abstract
Der ganztägige Workshop führt in DraCor (https://dracor.org) ein. Hierbei handelt es sich um eine offene Plattform zur Erforschung von Dramen in verschiedenen Sprachen. Anhand von praktischen Beispielen erlernen die Teilnehmer*innen Methoden der digitalen Dramenanalyse. Zunächst erfolgt eine Vorstellung des Konzepts der "Programmable Corpora" – infrastrukturell-forschungsorientierte, offene, erweiterbare, LOD-freundliche Volltextkorpora, die es ermöglichen sollen, auf niederschwellige Weise diverse Forschungsfragen aus dem Bereich der digitalen Literaturwissenschaft datenbasiert, nachvollziehbar und reproduzierbar zu bearbeiten. Danach wird in Hands-on-Tutorials in Kleingruppen eine praktische Einführung in das Erstellen von TEI-Dramenkorpora zur Analyse mit DraCor gegeben. Praktische Beispiele zu stilometrischen und netzwerkanalytischen Untersuchungen von Dramen führen in die Verwendung der DraCor-API ein. Ebenso werden Möglichkeiten zu korpusübergreifenden Abfragen und Einbeziehung von Informationen aus der Linked-Open-Data-Cloud mit SPARQL erprobt. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
12. Towards a Computational Study of German Book Reviews - A Comparison between Emotion Dictionaries and Transfer Learning in Sentiment Analysis
- Author
-
Rebora, Simone, Messerli, Thomas, Herrmann, J. Berenike, Geierhos, Michaela, Trilcke, Per, Börner, Ingo, Seifert, Sabine, Busch, Anna, Wuttke, Ulrike, Seltmann, Melanie, Genzel, Kristina, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Sentiment analysis ,Annotieren ,Machine learning ,DHd2022 ,Book reviews ,Inhaltsanalyse - Abstract
"This poster reports on the groundwork for the computational study of evaluative practices in German language book reviews. We trained classifiers for evaluation and sentiment at sentence level on the LOBO corpus, comprising ~1.3 million book reviews downloaded from the social reading platform LovelyBooks. For the two classification tasks, we compared performance of dictionary-based and transfer-learning (TL) based sentiment analysis (SA). Our results highlight the higher efficiency of TL-methods and of dictionaries based on vector space models (like SentiArt and AffectiveNorms). They show that computational methods can reliably identify sentiment of book reviews in German. " Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
13. Computational Literary Studies Data Landscape Review
- Author
-
Börner, Ingo, Charvat, Vera Maria, Ďurčo, Matej, Mrugalski, Michał, Odebrecht, Carolin, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Research Discovery ,Community-Bildung ,Data Landscape ,FAIR principles ,Organisation ,Metadaten ,Infrastruktur ,Forschungsergebnis ,Modellierung ,DHd2022 ,Computational Literary Studies ,Linked Open Data - Abstract
"Literarische Werke und deren digitale Repräsentationen stellen auch in den Fachbereichen der Computational Literary Studies (CLS) das Fundament für epistemische Auseinandersetzungen und Diskurse. In unserem Teilprojekt Data Selection and Curation des europäischen ""Computational Literary Studies Infrastructure""-Projekts möchten wir Brücken zu wissensbasierten Ressourcen für die CLS-Community aufbauen, um die Zugangsparadigmen für literarische Daten signifikant zu rekonfigurieren und erheblich zu verbessern. Um die Auffindbarkeit und den forschungsorientierten Zugang zu literarischen Daten für die CLS-Community zu ermöglichen, ist eine Inventarisierung der CLS-Datenlandschaft erforderlich, die forschungsrelevante Kriterien für die Datenauswahl sowie deren Erfassung und Beschreibung anwendet. Mit dieser Inventarisierung, die wir in Form einer Data Landscape Review durchführen, kann die vorhandene Datenlandschaft als digitales Erbe für CLS-Kontexte erst umfassend sichtbar und als Vorlage für weitere Forschungsvorhaben zugänglich gemacht werden. Unser Posterbeitrag präsentiert die Ergebnisse der Data Landscape Review, das Beschreibungsmodell, dessen Umsetzung in RDF und ein proof-of-concept des Online-Katalogs." Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
14. CLS INFRA: One Year in Practice
- Author
-
Birkholz, Julie M., van Rossum, Lisanne, Kunda, Bartlomiej, Tonra, Justin, Šeļa, Artjoms, Cinkova, Silvie, van Dalen-Oskam, K.H., Murphy, Ciara Lynn, Börner, Ingo, Chambers, Sally, Durco, Matej, Edmond, Jennifer, Tóth-Czifra, Erzsébet, Trilcke, Peer, Srishti, Sharma, Schöch, Christof, Raciti, Marco, Papaki, Eliza, Odebrecht, Carolin, Mrugalski, Michal, Kren, Michal, Garnett, Vicky, Eder, Maciej, Dudar, Julia, and Computationele Literatuurwetenschap (HI)
- Subjects
Infrastructure ,Research Practice ,Computational Literary Studies - Abstract
Computational Literary Studies Infrastructure, funded by the Horizon2020 grant scheme, is a four-year, pan-European project that aims to unify the diverse landscape of computational text analysis, in terms of available texts, tools, methods, practices and so forth, within its growing international user community. The project started out in February 2021, meaning that it has been underway for just over a year. In our poster we discuss the various deliverables and activities that have come out of the CLS INFRA project in its first quarter to give an idea of its impact in practice.
- Published
- 2022
15. CLS INFRA Poster Presentation DH2022 Tokyo
- Author
-
Birkholz, Julie, Börner, Ingo, Chambers, Sally, Charvat, Vera, Cinková, Silvie, Van Dalen-Oskam, Karina, Dejaeghere, Tess, Dudar, Julia, Ďurčo, Matej, Edmond, Jennifer, Evgeniia Fileva, Fischer, Frank, Heiden, Serge, Křen, Michal, Bartłomiej Kunda, Michał Mrugalski, Murphy, Ciara, Odebrecht, Carolin, Raciti, Marco, Ros, Salvador, Schöch, Christof, Šeļa, Artjoms, Tasovac, Toma, Tonra, Justin, Tóth-Czifra, Erzsébet, Trilcke, Peer, Eder, Maciej, and Van Rossum, Lisanne M.
- Subjects
Infrastructure ,Research practice ,Computational Literary Studies - Abstract
Computational Literary Studies Infrastructure, funded by the Horizon2020 grant scheme, is a four-year, pan-European project that aims to unify the diverse landscape of computational text analysis, in terms of available texts, tools, methods, practices and so forth, within its growing international user community. The project started out in February 2021, meaning that it has been underway for just over a year. In our poster we discuss the various deliverables and activities that have come out of the CLS INFRA project in its first quarter to give an idea of its impact in practice. 
- Published
- 2022
- Full Text
- View/download PDF
16. CLS INFRA D6.1 Inventory of existing data sources and formats
- Author
-
Ďurčo, Matej, Charvat, Vera Maria, Börner, Ingo, Mrugalski, Michał, and Odebrecht, Carolin
- Subjects
Metadata ,Data Landscape ,Data Modelling ,Computational Literary Studies ,Literary Corpora - Abstract
This deliverable summarises the work done to compile a comprehensive overview of the landscape of literary corpora and sources currently available. It describes the methodological approach of the work group and analyses the various challenges encountered in the effort to collect information about these resources and consolidate them into a structured form. Based on an initial inventory of 86 corpora or corpus sets, the report exemplifies their wide variety with respect to structure, context and purpose, and consequently the differing modes of provisioning. It also proposes a technological path towards making this information searchable via a central discovery catalogue by discussing principal design decisions regarding the data model and the technology stack needed for such a task.
- Published
- 2022
- Full Text
- View/download PDF
17. Review of the Data Landscape
- Author
-
Mrugalski, Michał, Odebrecht, Carolin, Charvat, Vera, Börner, Ingo, and Durco, Matej
- Subjects
data lanscape, literary text collections, corpus architecture, topology of corpora, FAIR principles - Abstract
This is a revew of the present-day data lanscape prepared as deliverable 5.1. in the framework of the Horizon2020 Project "Computational Literary Studies Infrastracture". It contains following sections: 1. Introduction: Enhancing Data Findability and Accessibility……………………..……..4 2. Reference Case Studies Highlighting Research Context and Corpus Design (Haiku, Slovak Novel)…………………………………………………………………………..7 3.Research Context: Impact of the Digital Paradigm on Literary Text Collections….…..9 3.1. “Literary” (Return of Essentialism, Poetics, and Classifications)……………………..12 3.2. “Text” (between Bag of Words and Ordered Hierarchy of Content Objects)………..15 3.3. Modelling vs. Exploratory Approaches to Textual Data……………………………….18 3.4. Use Case: Collecting the Haiku………………………………………………………….20 4. Corpus Design: Methods of Selection and Sampling (Use Case: the Slovak Novel)….23 4.1. Typology of Corpora According to Their Purpose……………………………………..25 4.1.1. General-Purpose Collections……………………………………………………….....26 4.1.2. Reference Corpora (Subcorpora of)………………………………………………….28 4.1.3. Digital Critical Editions………………………………………………………………….29 4.1.4. Monitor Corpora…………………………………………………………………………30 4.1.5. Corpora Compiled on the Basis of a Research Question…………………………..31 4.1.6. Opportunistic Corpora………………………………………………………………….31 4.2. Key Considerations for Selection and Sampling (Relative to Different Types of Corpora, e.g. Exploratory or Modelling)…………………………………………...…………32 4.2.1. Corpus Architecture / Composition (Size, Eligibility, Structuring of Texts and Annotations, Entity Typing)……………………………………………………………………34 4.2.2. Completeness…………………………………………………………………………..36 4.2.3. Representativeness…………………….………………………………………………37 4.2.4. Proportion (Balance)……………………………………………………………………38 4.2.5. Frequent Biases………………………………………………………………………...39 4.3. Data Formats………………………………………………………………………………41 4.4. Metadata’s Formats and Structures (Generic vs. Domain-Specific Repositories)….42 4.5. Access to Corpus Data: Retrieval Tools (GUI, APIs, OAI-PMH)…………………….45 5. Legal and Ethical Considerations………………………………………………………….46 6. Outlook……………………………………………………………………………………….51  
- Published
- 2022
- Full Text
- View/download PDF
18. Computational Literary Studies Infrastructure (CLSINFRA): a H2020 Research Infrastructure Project that aids to connect researchers, data, and methods
- Author
-
Birkholz, Julie M., Börner, Ingo, Chambers, Sally, Cinková, Silvie, van Dalen-Oskam, Karina, Dejaeghere, Tess, Dudar, Julia, Eder, Maciej, Edmond, Jennifer, Garnett, Vicky, Kren, Michal, Mrugalski, Michal, Murphy, Ciara L., Odebrecht, Carolin, Papaki, Eliza, Raciti, Marco, van Rossum, Lisanne, Schöch, Christof, Šela, Artjoms, Sharma, Srishti, Tonra, Justin, Tóth-Czifra, Erzsébet, Trilcke, Peer, and Computationele Literatuurwetenschap (HI)
- Subjects
Digital Humanities ,EU funded ,Computational Literary Studies - Abstract
The aim of this poster is to provide an overview of the principal objectives of the newly started H2020 Computational Literary Studies (CLS) project- https://www.clsinfra.io. CLS is a infrastructure project works to develop and bring together resources of high-quality data, tools and knowledge to aid new approaches to studying literature in the digital age. Conducting computational literary studies has a number of challenges and opportunities from multilingual and bringing together distributing information. At present, the landscape of literary data is diverse and fragmented. Even though many resources are currently available in digital libraries, archives, repositories, websites or catalogues, a lack of standardisation hinders how they are constructed, accessed and the extent to which they are reusable (Ciotti 2014). CLS project aims to federate these resources, with the tools needed to interrogate them, and with a widened base of users, in the spirit of the FAIR and CARE principles (Wilkinson et al. 2016). The resulting improvements will benefit researchers by bridging gaps between greater- and lesser- resourced communities in computational literary studies and beyond, ultimately offering opportunities to create new research and insight into our shared and varied European cultural heritage. Rather than building entirely new resources for literary studies, the project is committed to exploiting and connecting the already-existing efforts and initiatives, in order to acknowledge and utilize the immense human labour that has already been undertaken. Therefore, the project builds on recently- compiled high-quality literary corpora, such as DraCor and ELTeC (Fischer et al. 2019, Burnard et al. 2021, Schöch et al. in press), integrates existing tools for text analysis, e.g. TXM, stylo, multilingual NLP pipelines (Heiden 2010, Eder et al. 2016), and takes advantage of deep integration with two other infrastructural projects, namely the CLARIN and DARIAH ERICs. Consequently, the project aims at building a coherent ecosystem to foster the technical and intellectual findability and accessibility of relevant data. The ecosystem consists of (1) resources, i.e. text collections for drama, poetry and prose in several languages, (2) tools, (3) methodological and theoretical considerations, (4) a network of CLS scholars based at different European institutions, (5) a system of short-term research stays for both early career researchers and seasoned scholars, (6) a repository for training materials, as well as (7) an efficient dissemination strategy. This is achieved through a collaboration between participating institutions: Institute of Polish Language at the Polish Academy of Sciences, Poland; University of Potsdam, Germany; Austrian Academy of Sciences, Austria; National University of Distance Education, Spain; École Normale Supérieure de Lyon, France; Humboldt University of Berlin, German; Charles University, Czech Republic; Digital Research Infrastructure for the Arts and Humanities, France; Ghent Centre for Digital Humanities, Ghent University, Belgium; Belgrade Centre for Digital Humanities, Serbia; Huygens Institute for the History of the Netherlands (Royal Netherlands Academy of Arts and Sciences), Netherlands; Trier Center for Digital Humanities, Trier University, Germany; Moore Institute, National University of Ireland Galway, Ireland; This project has received funding from the European Union’s Horizon 2020 research and innovation programme under grant agreement No 101004984. References Ciotti, Fabio. 2014. „Digital literary and cultural studies: the state of the art and perspectives“.Between4/8, 1-17.https://doi.org/10.13125/2039-6597/1392. Borgman, Christine. 2010. Scholarship in the Digital Age : Information, Infrastructure, andthe Internet. Cambridge, Mass & London: MIT Press. See https://www.dariah.euandhttps://www.clarin.eu. Burnard, Lou, Christof Schöch, and Carolin Odebrecht. 2021. „In search of comity: TEI fordistant reading“.Journal of the Text Encoding Initiative. https://doi.org/10.4000/jtei.3500. Eder, M., Rybicki, J. and Kestemont, M. 2016. Stylometry with R: a package forcomputational text analysis.R Journal, 8(1): 107-21.https://journal.r-project.org/archive/2016/RJ-2016-007/index.html Fischer, Frank, Ingo Börner, Matthias Göbel, Andrea Hechtl, Christopher Kittel, P. Miling, andPeer Trilcke. 2019. „Programmable Corpora: Introducing DraCor, an Infrastructure for theResearch on European Drama“. InBook of Abstractsof the Digital Humanities Conference2019. Utrecht: ADHO. Heiden, Serge. 2010. The TXM Platform: Building Open-Source Textual Analysis SoftwareCompatible with the TEI Encoding Scheme. In24th PacificAsia Conference on Language,Information and Computation(pp. 10 p.). Sendai, Japon.Retrieved fromhttp://halshs.archivesouvertes.fr/docs/00/54/97/64/PDF/paclic24_sheiden.pdf Schöch, Christof, Tomaz Erjavec, Roxana Patras, and Diana Santos (in press). „Creatingthe European Literary Text Collection (ELTeC): Challenges and Perspectives”.ModernLanguages Open. Wilkinson, Mark D., Michel Dumontier, IJsbrand Jan Aalbersberg, Gabrielle Appleton, MylesAxton, Arie Baak, Niklas Blomberg. 2016. „The FAIR Guiding Principles for Scientific DataManagement and Stewardship“.Scientific Data 3(1).https://doi.org/10.1038/sdata.2016.18.
- Published
- 2022
19. Lieblingsgegenden, Fenster und Mauern. Zur emotionalen Enkodierung von Raum in Deutschschweizer Prosa zwischen 1850 und 1930
- Author
-
Herrmann, J. Berenike, Grisot, Giulia, Geierhos, Michaela, Trilcke, Per, Börner, Ingo, Seifert, Sabine, Busch, Anna, Wuttke, Ulrike, Seltmann, Melanie, and Genzel, Kristina
- Abstract
Ausgehend vom übergreifenden Forschungsinteresse einer datenbasierten Komparatistik der deutschsprachigen Länder möchte unser Beitrag erste Ergebnisse berichten über die emotionale Enkodierung von fiktionalem Raum. Anhand des DCHLi (Deutschschweizer Literaturkorpus), zurzeit als Pilotkorpus (76 Texte, 1854-1930, ca. 2 Mio. Wörter), und ausgehend von einem semiotischen Zugang zu textuell enkodierten Emotionen und Raumanalyse legen wir den derzeit gängigen Diktionär-basierten Zugang zu dimensionalen (Valenz, Arousal) und diskreten Emotionen (“Angst”, “Freude”, “Wut”, “Trauer”, „Ekel“) an. Welche unterschiedlichen Typen von Landschaft und Raum gibt es in der fiktionalen deutschschweizer Prosa zwischen 1854 und 1930, und wie sind diese jeweils emotional enkodiert? Unsere quantitative Befunde stellen Bezüge her zu ikonischen Kultur/Natur-Dichotomien im Erbe der Romantik, zu historischen Stadt/Land-Konstellationen, aber auch zu einem nationalliterarischen Rahmen mit vielbeklagtem Schweizer “Mythos” einerseits und identifikatorischen (oftmals Alpen-orientierten) Angeboten für die “imagined community” (Anderson) der sogenannten Willensnation andererseits. Wir schließen mit einer methodologischen Reflexion der Sentimentanalyse innerhalb der DH.
- Published
- 2022
20. Computational Literary Studies Infrastructure (CLSINFRA): a H2020 Research Infrastructure Project that aids to connect researchers, data, and methods
- Author
-
van Dalen-Oskam, Karina, Odebrecht, Carolin, Edmond, Jennifer, Garnett, Vicky, Cinková, Silvie, Börner, Ingo, van Rossum, Lisanne, Sharma, Srishti, Chambers, Sally, Mrugalski, Michał, Dudar, Julia, Papaki, Eliza, Tonra, Justin, Murphy, Ciara, Trilcke, Peer, Raciti, Marco, Křen, Michal, Birkholz, Julie, Eder, Maciej, Schöch, Christof, Dejaeghere, Tess, and Tóth-Czifra, Erszsébet
- Abstract
The aim of this poster is to provide an overview of the principal objectives of the newly started H2020 Computational Literary Studies (CLS) project- https://www.clsinfra.io. CLS is a infrastructure project works to develop and bring together resources of high-quality data, tools and knowledge to aid new approaches to studying literature in the digital age. Conducting computational literary studies has a number of challenges and opportunities from multilingual and bringing together distributing information. At present, the landscape of literary data is diverse and fragmented. Even though many resources are currently available in digital libraries, archives, repositories, websites or catalogues, a lack of standardisation hinders how they are constructed, accessed and the extent to which they are reusable (Ciotti 2014). CLS project aims to federate these resources, with the tools needed to interrogate them, and with a widened base of users, in the spirit of the FAIR and CARE principles (Wilkinson et al. 2016). The resulting improvements will benefit researchers by bridging gaps between greater- and lesser- resourced communities in computational literary studies and beyond, ultimately offering opportunities to create new research and insight into our shared and varied European cultural heritage. Rather than building entirely new resources for literary studies, the project is committed to exploiting and connecting the already-existing efforts and initiatives, in order to acknowledge and utilize the immense human labour that has already been undertaken. Therefore, the project builds on recently- compiled high-quality literary corpora, such as DraCor and ELTeC (Fischer et al. 2019, Burnard et al. 2021, Schöch et al. in press), integrates existing tools for text analysis, e.g. TXM, stylo, multilingual NLP pipelines (Heiden 2010, Eder et al. 2016), and takes advantage of deep integration with two other infrastructural projects, namely the CLARIN and DARIAH ERICs. Consequently, the project aims at building a coherent ecosystem to foster the technical and intellectual findability and accessibility of relevant data. The ecosystem consists of (1) resources, i.e. text collections for drama, poetry and prose in several languages, (2) tools, (3) methodological and theoretical considerations, (4) a network of CLS scholars based at different European institutions, (5) a system of short-term research stays for both early career researchers and seasoned scholars, (6) a repository for training materials, as well as (7) an efficient dissemination strategy. This is achieved through a collaboration between participating institutions: Institute of Polish Language at the Polish Academy of Sciences, Poland; University of Potsdam, Germany; Austrian Academy of Sciences, Austria; National University of Distance Education, Spain; École Normale Supérieure de Lyon, France; Humboldt University of Berlin, German; Charles University, Czech Republic; Digital Research Infrastructure for the Arts and Humanities, France; Ghent Centre for Digital Humanities, Ghent University, Belgium; Belgrade Centre for Digital Humanities, Serbia; Huygens Institute for the History of the Netherlands (Royal Netherlands Academy of Arts and Sciences), Netherlands; Trier Center for Digital Humanities, Trier University, Germany; Moore Institute, National University of Ireland Galway, Ireland
- Published
- 2022
21. CLS Infra Computational Literary Studies Infrastructure
- Author
-
Ros, Salvador, van Dalen-Oskam, Karina, Odebrecht, Carolin, Tasovac, Toma, Edmond, Jennifer, Tóth-Czifra, Erszsébet, Cinková, Silvie, Börner, Ingo, van Rossum, Lisanne, Chambers, Sally, Mrugalski, Michał, Charvat, Vera, Schöch, Christof, Tonra, Justin, Kunda, Bartłomiej, Murphy, Ciara, Raciti, Marco, Trilcke, Peer, Šeļa, Artjoms, Křen, Michal, Birkholz, Julie, Eder, Maciej, Heiden, Serge, Fischer, Frank, Dudar, Julia, Ďurčo, Matej, Dejaeghere, Tess, and Fileva, Evgeniia
- Abstract
Computational Literary Studies Infrastructure, funded by the Horizon2020 grant scheme, is a four-year, pan-European project that aims to unify the diverse landscape of computational text analysis, in terms of available texts, tools, methods, practices and so forth, within its growing international user community. The project started out in February 2021, meaning that it has been underway for just over a year. In our poster we discuss the various deliverables and activities that have come out of the CLS INFRA project in its first quarter to give an idea of its impact in practice.
- Published
- 2022
22. CLS INFRA D1.1 Data Management Plan and Open Research Data Pilot (V1, M6)
- Author
-
Tóth-Czifra, Erzsébet, Edmond, Jennifer, Eder, Maciej, Odebrecht, Caroline, Cinkova, Silvie, Börner, Ingo, Birkholz, Julie, Chambers, Sally, Schöch, Christoph, Durco, Matej, Fischer, Frank, and Tonra, Justin
- Subjects
Literary studies ,Open data ,Research data management - Abstract
Project summary The digital age offers challenges and opportunities for completing research on Europe’s multilingual and interconnected literary heritage. Even though many resources are currently available in digital libraries, a lack of standardisation hinders their access and reuse. The EU funded CLS INFRA project will help build the shared and sustainable infrastructure needed to undertake literary studies in the digital age. The project will align these diverse resources with each other, with the tools needed to interrogate them, and with a widened base of users. The resulting improvements will benefit researchers by bridging gaps between greater and lesserresourced communities in computational literary studies and beyond, ultimately offering opportunities to create new research and insight into our shared and varied European cultural heritage. Executive summary This deliverable presents the first version of Data Management Plan for the Horizon 2020 project CLS INFRA. To maximise the potential of the present document as a living and functional project management tool, the team decided to accommodate to this present DMP all sorts of digital scholarly objects that qualify as data or software and that are deemed worthy to be captured and preserved for reuse. Following the Horizon 2020 Data Management Plan template and guidelines, the document first defines the scope and selection criteria for project outputs (1.1.) and provides a structured overview of data and software collected, created, and (re)used for and by the CLS INFRA project. The second, FAIR data chapter describes the provisions made or envisioned to accommodate the FAIR principles and thereby future usage of CLS INFRA data resources. The third chapter provides a similar FAIR assessment of software resources. The fourth chapter describes roles, responsibilities and practical commitments and safeguards that are in place for the successful implementation of the DMP. The fifth chapter covers data security aspects. In the final chapter, we accommodated discussions around ethical aspects such as safeguards for personal data handling and safeguards for adherence to intellectual property rights are discussed. While preparing the DMP, special attention has been given to domain and disciplinary specificities. The CLS INFRA Data Management Plan is a living document and shall be updated continuously throughout the project in line with the new information gathered via conducting the project activities
- Published
- 2021
- Full Text
- View/download PDF
23. Editorial
- Author
-
Tezarek, Laura, Zolles, Christian, Börner, Ingo, Innerhofer, Roland, and Fetz, Bernhard
- Abstract
Die HerausgeberInnen der 1. Nummer der Wiener Digitalen Revue führen in den Schwerpunkt „Tagebücher 1945–1955. Zwischen zeitgeschichtlicher und poetischer Reflexion“ ein. Dessen Beiträge gehen zurück auf eine gleichnamige Konferenz, die am 21. September 2017 an der Universität Wien stattfand und bei der deutschsprachige AutorInnentagebücher aus der unmittelbaren Nachkriegszeit auf ihren literarhistorischen Wert und zeithistorischen Dokumentationscharakter hin befragt wurden. Dementsprechend versuchen die Beiträge des Schwerpunkte das Verhältnis von Dichtung und Zeitzeugenschaft, Privatheit und Öffentlichkeit sowie Autorschaft und literarisches Feld mit Fokus auf die Jahre 1945–1955 auszuloten. The editors of the first number of Wiener Digitale Revue introduce the focus on “Diaries 1945–1955. Between contemporary history and poetic reflection.” Its contributions were first presented at a conference at the University of Vienna by the same title on 21 September 2017, and address the literary historical and documentary value for contemporary history of German language authors’ diaries from the immediate post-war era. The focal topic contributions range from explorations of the relationship between poetry and the role of contemporary testimony, the private and the public, to authorship and the literary field with a focus on the years between 1945 and 1955., Wiener Digitale Revue, Nr. 1 (2020): Tagebuch
- Published
- 2020
- Full Text
- View/download PDF
24. Karl Kraus contra …, or: text contra action
- Author
-
Prager, Katharina, Hannesschläger, Vanessa, and Börner, Ingo
- Subjects
taxonomy ,historical legal documents ,Karl Kraus ,TEI ,SKOS ,digital edition ,controlled vocabulary - Abstract
In the project to be presented, the legal papers of the Austrian satirist Karl Kraus (1874-1936) are being edited according to the TEI Guidelines and will be provided digitally and contextualized with Kraus’ oeuvre as a whole. Kraus welcomed the reform of the Austrian Press Law of 1922, which marked the beginning of the writer’s growing fondness for litigation. In the same year, Oskar Samek became his lawyer. In the course of the following 15 years, they were involved in over 200 court actions together. The material documenting these actions is the focus of our project. Even though the material’s volume (approx. 8000 pages) is a challenge in itself, the most demanding aspect of these documents is their heterogeneity: typescripts, manuscripts, pre-printed forms, carbon copies, and receipts are only some examples of material types we are working with. In addition to the diverse materialities, the heterogeneous functions of the materials (statements, summons, verdicts, correspondences, etc.) pose a challenge as the exact functions of document types have to be understood before the document’s qualities can be encoded. In this paper, we will focus on the document characteristics that are not per se inherent in the text these documents carry, i.e. the documents’ functions in relation to real-world processes such as court actions and daily procedures in a lawyer’s office. As suggested by Hannesschläger and Andorfer (2019: 8), “the Text Encoding Initiative’s guidelines, while the unquestionably best approach for encoding text inherent phenomena, reach their limits when used for encoding ‘real world phenomena’ related to text genesis”. One of the approaches to tackle this problem is to develop a taxonomy in SKOS format to model these processes, i.e. a reusable, TEI-external classification scheme of text types that include different types of juridical documents, court actions, and the procedures in a lawyer’s office. In this paper, we will introduce the project, explain our approach and describe the integration of our SKOS taxonomy into the TEI documents containing the texts of our edition by making use of the versatile @ana attribute and the possibilities to include external metadata within the element. References Vanessa Hannesschläger, Peter Andorfer. I Want it All, I Want it Now. Literature researcher meets programmer. In Steven Krauwer, Darja Fišer (Eds.). Twin Talks at DHN2019: Understanding Collaboration in DH. Proceedings. Copenhagen 2019. URL: https://cst.dk/DHN2019Pro/TwinTalksWorkshopProceedings.pdf
- Published
- 2019
- Full Text
- View/download PDF
25. Programmable Corpora: Introducing DraCor, an Infrastructure for the Research on European Drama
- Author
-
Fischer, Frank, Börner, Ingo, Göbel, Mathias, Hechtl, Angelika, Kittel, Christopher, Milling, Carsten, and Trilcke, Peer
- Subjects
Digital Humanities ,Literary Studies ,ComputingMilieux_PERSONALCOMPUTING ,FOS: Languages and literature ,Text Encoding Initiative ,Linked Open Data ,Drama - Abstract
DraCor (short for "drama corpora") is a growing collection of TEI-encoded plays in (mostly) European languages. The project showcases the concept of "Programmable Corpora", conceived as research ecosystems revolving around an API that provides access to bespoke slices of extracted data. DraCor also exposes a SPARQL endpoint to connect its semantic entities (authors, plays, characters, etc.) to the Linked Open Data cloud.
- Published
- 2019
- Full Text
- View/download PDF
26. Programmable Corpora – Die digitale Literaturwissenschaft zwischen Forschung und Infrastruktur am Beispiel von DraCor
- Author
-
Fischer, Frank, Börner, Ingo, Göbel, Mathias, Hechtl, Angelika, Kittel, Christopher, Milling, Carsten, Trilcke, Peer, Sahle, Patrick, and Helling, Patrick
- Subjects
DHd2019 ,Infrastruktur ,Literaturwissenschaft ,Dramenforschung - Abstract
A single abstract from the DHd-2019 Book of Abstracts., Sofern eine editorische Arbeit an dieser Publikation stattgefunden hat, dann bestand diese aus der Eliminierung von Bindestrichen in Überschriften, die aufgrund fehlerhafter Silbentrennung entstanden sind, der Vereinheitlichung von Namen der Autor*innen in das Schema "Nachname, Vorname" und/oder der Trennung von Überschrift und Unterüberschrift durch die Setzung eines Punktes, sofern notwendig., {"references":["https://doi.org/10.5281/zenodo.2600812","https://github.com/DHd-Verband/DHd-Abstracts-2019"]}
- Published
- 2019
- Full Text
- View/download PDF
27. Cäsar Flaischlens 'Graphische Litteratur-Tafel' – digitale Erschließung einer großformatigen Karte zur Deutschen Literatur
- Author
-
Börner, Ingo, Fischer, Frank, Hechtl, Angelika, Jäschke, Robert, Trilcke, Peer, Vogeler, Georg, and Helling, Patrick
- Subjects
Bildanalyse ,DHd2018 ,Literaturgeschichtsschreibung ,Literaturkarte ,TEI Encoding - Abstract
A single abstract from the DHd-2018 Book of Abstracts., Sofern eine editorische Arbeit an dieser Publikation stattgefunden hat, dann bestand diese aus der Eliminierung von Bindestrichen in Überschriften, die aufgrund fehlerhafter Silbentrennung entstanden sind, der Vereinheitlichung von Namen der Autor*innen in das Schema "Nachname, Vorname" und/oder der Trennung von Überschrift und Unterüberschrift durch die Setzung eines Punktes, sofern notwendig., {"references":["https://doi.org/10.5281/zenodo.3684897","https://github.com/DHd-Verband/DHd-Abstracts-2018"]}
- Published
- 2018
- Full Text
- View/download PDF
28. Brecht Beats Shakespeare! – A Card-Game Introduction to the Network Analysis of European Drama (poster contribution to DH2018)
- Author
-
Fischer, Frank, Schultz, Anika, Kittel, Christopher, Beshero-Bondar, Elisa, Martus, Steffen, Trilcke, Peer, Wolf, Jana, Börner, Ingo, Hechtl, Angelika, Skorinkin, Daniil, Orlova, Tatiana, Milling, Carsten, and Ivanovic, Christine
- Abstract
This is our DH2018 poster contribution: "Brecht Beats Shakespeare! – A Card-Game Introduction to the Network Analysis of European Drama". Release date: 27 June 2018, Ciudad de México.The poster contains a full-fledged card game that sets out to instruct players in European literary history and network theory. The cards contain social networks extracted from 32 plays in 12 European languages reaching from antiquity up to the modern age (from Aeschylus to Beckett).A network visualisation and a handful of network-analytical values produce comparability. This type of card game is known to English speakers as "Top Trumps", or as "Supertrumpf" in the German context.Graphs were visualised with Gephi using "Force Atlas 2" as default layout algorithm. The colour gradient from red to blue indicates different communities distinguished from each other by employing standard threshold values. This division does not have to be meaningful per se.The underlying data is available on our GitHub repo.
- Published
- 2018
- Full Text
- View/download PDF
29. Collaborative Encoding of Text Genesis: A Pedagogical Approach for Teaching Genetic Encoding with the TEI
- Author
-
Apostolo, Stefano, primary, Börner, Ingo, additional, and Hechtl, Angelika, additional
- Published
- 2019
- Full Text
- View/download PDF
30. Cäsar Flaischlens Graphische Litteratur-Tafel digital
- Author
-
Börner, Ingo, Fischer, Frank, Hechtl, Angelika, Jäschke, Robert, and Trilcke, Peer
- Subjects
Digital Humanities - Abstract
The "Graphische Litteratur-Tafel" from 1890 is a depiction of the influence of foreign literature on German literature by Cäsar Flaischlen (1864–1920). The poster describes (in German) the digital processing and augmentation of the work.This poster was presented at the 3rd DHA conference. An interactive version can be found at http://litteratur-tafel.weltliteratur.net/.
- Published
- 2017
- Full Text
- View/download PDF
31. Orientation of native versus translocated juvenile lesser spotted eagles (Clanga pomarina) on the first autumn migration
- Author
-
Meyburg, Bernd-U., primary, Bergmanis, Ugis, additional, Langgemach, Torsten, additional, Graszynski, Kai, additional, Hinz, Arno, additional, Börner, Ingo, additional, Meyburg, Christiane, additional, and Vansteelant, Wouter M. G., additional
- Published
- 2017
- Full Text
- View/download PDF
32. Quantitative Aufführungsanalysen zu Stücken Johann Nestroys
- Author
-
Börner, Ingo, Hecht, Angelika, Stigler, Johannes, and Helling, Patrick
- Subjects
DHd2015 - Abstract
A single abstract from the DHd-2015 Book of Abstracts., Sofern eine editorische Arbeit an dieser Publikation stattgefunden hat, dann bestand diese aus der Eliminierung von Bindestrichen in Überschriften, die aufgrund fehlerhafter Silbentrennung entstanden sind, der Vereinheitlichung von Namen der Autor*innen in das Schema "Nachname, Vorname" und/oder der Trennung von Überschrift und Unterüberschrift durch die Setzung eines Punktes, sofern notwendig., {"references":["http://gams.uni-graz.at/o:dhd2015.abstracts-gesamt","https://github.com/DHd-Verband/DHd-Abstracts-2015"]}
- Published
- 2015
- Full Text
- View/download PDF
33. Wissenschaftler und Weltenerschaffer. Der Erzähler in Valerij Brjusovs ‚Respublika Južnogo Kresta‘
- Author
-
Börner, Ingo
- Abstract
The abstract is available here: https://uscholar.univie.ac.at/o:401731
- Published
- 2015
34. Unter Unzuverlässigkeitsverdacht
- Author
-
Börner, Ingo
- Abstract
In Valerij Brjusovs Erzählung „Respublika Južnogo Kresta“ (1904–1905), die in Form einer Reportage gestaltet ist, berichtet ein Journalist von einer Epidemie in einer futuristischen Republik am Südpol. Obwohl er mehrfach betont, dass sich sein Bericht einzig auf belegbares Faktenmaterial stützen würde, hat der Rezipient gute Gründe, an der Glaubwürdigkeit des Reporters zu zweifeln, da sich seine Fakten als zweifelhaft herausstellen. In der Diplomarbeit wird die These aufgestellt, dass es sich bei dem Journalisten um einen „Unzuverlässigen Erzähler“ handelt. In der Forschungsliteratur zu dieser Science-Fiction-Erzählung wird gemeinhin die Ansicht vertreten, dass im Text die Ereignisse der Russischen Revolution von 1905 ihren Niederschlag finden. In diesen Interpretationen wird aber die Bedeutung der erzählerischen Mittel übersehen. Im Anschluss an eine Übersicht über die Publikationsgeschichte und den Forschungsstand werden die erzählerischen und stilistischen Besonderheiten herausgearbeitet, um zu zeigen, dass der Text den pseudowissenschaftlichen Diskurs des Erzählers unterläuft., In Valery Bryusovs short-story "The Republic of the Southern Cross" (1904-1905) a journalist reports on a plague in a futuristic republic on the South Pole. Even though he stresses the fact that his account given is based solely on hard facts, the reader has reason to doubt his reliability for the facts turn out to be quite problematic. In the thesis the question is posed whether the journalist can be described as an "unreliable narrator". In the scholarly discussion the story is commonly interpreted in relation to the historical events of the abortive Russian revolution of 1905 but this kind of interpretation overlooks the importance of narra-tive technique in the story. After an overview of the history of publication and the scholarly discussion on the text, the narrative devices and the stylistitc features are analyzed to point out that the text undermines the pseudo-scientific discourse of the narrator.
- Published
- 2013
- Full Text
- View/download PDF
35. Pragmatisches Forschungsdatenmanagement - qualitative und quantitative Analyse der Bedarfslandschaft in den Computational Literary Studies
- Author
-
Helling, Patrick, Jung, Kerstin, Pielström, Steffen, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Archivierung ,FDM ,CLS ,Infrastruktur ,Forschungsdatenmanagement ,Literatur ,Computational Literary Studies ,Projektmanagement ,Geisteswissenschaften ,Digital Humanities ,Organisation ,DHd ,Literaturwissenschaften ,Interview ,DHd2022 - Abstract
Die Computational Literary Studies (CLS) sind ein interdisziplinäres Forschungsfeld im Schnittpunkt von Literaturwissenschaft, Computerlinguistik und Informatik, in dem digitale Forschungsdaten eine zentrale Rolle spielen. Elf Forschungsprojekte aus den CLS sind derzeit in einem DFG-Schwerpunktprogramm organisiert. Um die Forschungsdatenmanagement-Bedarfslandschaft in den Projekten zu erfassen und zu bedienen, wurde ein mehrstufiges Verfahren mit Interviewgesprächen, Analyseschritten und Reviewphasen implementiert. In Leitfaden-gestützten Interviews beantworteten die Teilnehmer*innen insgesamt 47 Fragen. Im Zuge der ersten Auswertung wurde ein Antworteninventar erstellt und den Projekten nochmals zur Überarbeitung zur Verfügung gestellt. Es zeigte sich u.a. ein breites Spektrum an Forschungsdaten und eine zentrale Rolle von kollaborativ genutzten Modellen und Programmcodes. Um die identifizierten Bedarfe zu bedienen, wurde zur Bündelung der Datenpublikationen eine Zenodo-Community eingerichtet. Ferner haben die Partnerinstitutionen nun die Möglichkeit, über eine gemeinsame Gitlab-Instanz kollaborativ an Datenbeständen zu arbeiten. Nach der Implementierung dieser pragmatischen Lösungen liegt der weitere Fokus nun auf der Entwicklung einer gemeinsamen Archivierungsstrategie. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
36. Der CLARIAH-DE Tutorial Finder - Eine Suchumgebung f��r Lehr- und Schulungsmaterialien in den Digital Humanities
- Author
-
Werthmann, Antonina, Gradl, Tobias, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Organisation ,Tutorial Finder ,Übergreifende Suche ,Lehre ,Metadaten ,Lehr- und Schulungsmaterialien ,CLARIAH-DE ,Infrastruktur ,Teilen ,DHd2022 ,��bergreifende Suche ,Daten - Abstract
Der Beitrag stellt einen im Rahmen des CLARIAH-DE Projekts entwickelten Dienst – den Tutorial Finder – vor. Dieser greift auf frei zugängliche und nachnutzbare Sammlungen von Lehr- und Schulungsmaterialien im Bereich der Digital Humanities (DH) zu und erlaubt es, sie in einem zentralen Verzeichnis zu durchsuchen. Die im Tutorial Finder erfassten Sammlungen stammen aus nationalen und internationalen Quellen und bieten vielfältige Materialien in unterschiedlichen Formaten an. Diese reichen dabei von einfachen Dokumentationen über aufgezeichnete Vorträge und Präsentationsfolien bis hin zu didaktisch-methodisch ausgearbeiteten Lerneinheiten und Modulen. Das offene Angebot des Tutorial Finders, das weiter verstetigt und erweitert wird, kann nicht nur von Lehrenden, Forschenden und Studierenden der DH zum Selbstlernen oder Einsetzen im Unterricht genutzt werden, sondern bietet allen Interessierten eine Möglichkeit, eigene Lehr- und Schulungsmaterialien einem möglichst breiten Nutzerkreis zugänglich zu machen und ihre langfristige Nachnutzbarkeit zu stärken. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
37. 'Wie W��lkchen im Morgenlicht' - Zur automatisierten Metaphern-Erkennung und der Datenbank literarischer Raummetaphern laRa
- Author
-
Schumacher, Mareike, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
benannte Entitäten (named entities) ,Kontextsetzung ,Methoden ,Metadaten ,benannte Entit��ten (named entities) ,Metaphern ,Methodenvergleich ,DHd2022 ,Literatur ,Textanalyse ,Text - Abstract
In diesem Beitrag werden zwei methodische Herangehensweisen an das Phänomen literarischer Raummetaphern im 18.-21 Jahrhundert kontrastiert. Ausgangspunkt der Untersuchung war die automatische Erkennung und Klassifizierung von Raumreferenzen in literaischen Texten mithilfe von Machine-Learning-Technologie. Da Metaphern sich dabei als erheblicher Störfaktor erwiesen, wurden diese zunächst ins Training mit einbezogen. Als die Methode der automatisierten Metaphern-Erkennung scheiterte, wurde eine relationale Graphdatenbank literarischer Raummetaphern (laRa) angelegt. Eine Metadatenanalyse von laRa zeigt, warum das maschinelle Erlernen der Erkennung von Raummetaphern in literarischen Texten scheitern musste. Sie gibt außerdem eine Reihe von Hinweisen auf Gestaltung und Nutzung literarischer Raummetaphern. Eine Beispielanalyse der "Weg"-Metapher verdeutlicht, inwiefern Spezifik und Variantenreichtum im diachronen Verlauf charakteristisch für Raummetaphern sind und dient als Cross-Falsifizierung der zuerst gewählten Methodik. Ein Betrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
38. GitMA-Poster - CATMA-Daten via Git abrufen und mittels Python-Bibliothek weiterverarbeiten
- Author
-
Meister, Malte, Vauth, Michael, Gerstorfer, Dominik, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Einführung ,Annotieren ,Bearbeitung ,Einf��hrung ,DHd2022 ,Visualisierung ,CATMA ,Git ,Daten ,Software ,Python - Abstract
Seit CATMA Version 6.0 kann auf Projektdaten in Form von Git Repositorien zugegriffen werden. Im Fachbereich für Digital Philology an der TU Darmstadt ist außerdem eine Python-Bibliothek entstanden, die einen einfachen Zugriff auf diese zulässt. Die Bilbiothek ermöglicht die Weiterverarbeitung der Annotationen mit gängigen Python Datascience-Tools. Das Poster wird eine Art Bedienungsanleitung für die Nutzung des CATMA Git Access und der Python-Bibliothek sein. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
39. Beyond the render silo - Semantically annotating 3D data within an integrated knowledge graph and 3D-rendering toolchain
- Author
-
Rossenova, Lozana, Schubert, Zoe, Vock, Richard, Bl��mel, Ina, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
enrichment ,Kontextsetzung ,Archivierung ,Annotieren ,3D-Bilder ,Kollaboration ,Daten ,semantic web ,knowledge graph ,annotation ,3D-models ,Kompakkt ,DHd2022 ,Wikibase ,3D-rendering ,Linked Open Data - Abstract
As a result of mass-digitisation efforts, cultural heritage and research institutions have had to adapt their practices to account for shifts in what cultural stewardship and the study of cultural memory entails. Representations of cultural assets in the form of 3D models within disciplines such as architecture, art, archaeology, and 3D reconstruction are particularly heterogeneous in formats and structure, ergo standardized access and visualisation tools face new challenges. Furthermore, cultural memory preservation requires the active participation of diverse audiences who can easily access, search and enrich datasets through annotations and critical interpretations. This poster presents the development of a suite of tools as part of the NFDI4Culture project focusing on such enrichment. The toolchain facilitates the annotation of 3D data within a knowledge graph (Wikibase) and a sophisticated rendering environment (Kompakkt), so that 3D objects��� geometry, attendant metadata and annotations are accessible and searchable as part of the semantic web., The extended abstract for this poster is published separately as part of the DHd 2022 Proceedings and is available here: https://zenodo.org/record/6328155
- Published
- 2022
- Full Text
- View/download PDF
40. Mithilfe von Machine Reasoning alchemische Decknamen entschlüsseln
- Author
-
Lang, Sarah, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Kontextsetzung ,Sprache ,Annotation ,Annotieren ,Modellierung ,Alchemie ,Frühe Neuzeit ,DHd2022 ,Machine Reasoning ,Beziehungsanalyse ,Literatur - Abstract
"Der Übergang von alchemischer Sprache zu chemischer Nomenklatur wird mitunter sogar erst als die Geburtsstunde der Chemie im Zuge einer 'Chemical Revolution' angesehen. Neuere Studien der Alchemiegeschichte zeigen jedoch, dass auch hinter der vormals häufig als obskur und sinnfrei bezeichneten Sprache der Alchemie valide chemische Erkenntnisse standen. Doch könnte nicht eine computergestützte Analyse dem alchemistischen Stilmittel der sogenannten 'Decknamen' beikommen? Eine digitale Methode zur automatisierten semantischen Annotation und halbautomatisierten Disambiguierung macht im Kontext eines digitalen Korpus mithilfe von Machine Reasoning alchemische Sprache systematisch analysierbar. Dazu wird ein Semantic Web Wissensorganisationssystem unter der Verwendung von SKOS und RDFS sowie andererseits automatisierte Annotation semanitscher Ambiguität verwendet. Der vorliegende Beitrag stellt die Ergebnisse der Implementation eines solchen Algortihmus anhand des Korpus Michael Maiers (1568-1622) vor und diskutiert dessen Übertragbarkeit auf andere Quellen." Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
41. Linked Open Data für die Literaturgeschichtsschreibung - Das Projekt 'Mining and Modeling Text'
- Author
-
Hinzmann, Maria, Schöch, Christof, Dietz, Katharina, Klee, Anne, Erler-Fridgen, Katharina, Röttgermann, Julia, Steffes, Moritz, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Literaturgeschichte ,Informationsextraktion ,Datenerkennung ,Metadaten ,Modellierung ,Datenmodellierung ,Identifizierung ,DHd2022 ,Literatur ,Linked Open Data - Abstract
Im Umgang mit dem stetig wachsenden 'digitalen Kulturerbe' bietet die Weiterentwicklung der systematischen Datenerschließung und Wissensrepräsentation bisher nicht ausgeschöpfte Potentiale für die Literaturgeschichtsschreibung. Vor diesem Hintergrund werden im Projekt "Mining and Modeling Text" (MiMoText) quantitative Methoden der Informationsextraktion ('Mining') und Datenmodellierung ('Modeling') ineinander verschränkt, um ein literaturgeschichtliches Informationssystem aufzubauen. Die Transferierbarkeit in andere Domänen wird berücksichtigt. Zentrales Anliegen ist es, den Bereich der quantitativen Methoden zur Extraktion, Modellierung und Analyse geisteswissenschaftlich relevanter Informationen aus umfangreichen Textsammlungen weiterzuentwickeln und aus interdisziplinärer (geistes-, informatik- und rechtswissenschaftlicher) Perspektive zu erforschen. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
42. Peer-to-Peer-Workshop zum Projekt Management in den Digital Humanities
- Author
-
Cremer, Fabian, Dogunke, Swantje, Neubert, Anna, Wübbena, Thorsten, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Projektmanagement ,Reflektion ,Theoretisierung ,Community-Bildung ,Vernetzung ,Peer-to-Peer ,Projekte ,Kommunikation ,DHd2022 ,Curricula - Abstract
Welche Fähigkeiten und Kompetenzen sind für das Projektmanagement in den DH entscheidend und wie werden diese erlernt oder erfahren? Welche Rollen und welches Rollenverständnis bilden Grundlage für die Zusammenarbeit? Wie lässt im Wissenschaftssystem aus Aufgaben im Projektmanagement Anerkennung und Reputation gewinnen? In unserem Peer-to-Peer-Workshop wollen wir im Rahmen eines World Cafés diesen und anderen Fragen nachgehen und mit allen interessierten Forscher*innen und Projektmanager*innen diskutieren und dabei einen Raum schaffen, sich über methodische Fragen und persönliche Erfahrungen mit Projektplanung, Projektmanagements und Koordinierungsaufgaben in der digitalen interdisziplinären Wissensproduktion auszutauschen. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
43. correspSearch v2.0 - Briefeditionen vernetzen
- Author
-
Dumont, Stefan, Grabsch, Sascha, Müller-Laackman, Jonas, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
benannte Entitäten (named entities) ,benannte Entit��ten (named entities) ,Bearbeitung ,Netzwerkanalyse ,DHd2022 ,Visualisierung ,Sammlung ,Datenaggregation ,Normdaten ,Text - Abstract
Eine Posterpräsentation auf der 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
44. Who CAREs, really? Vom schwierigen Umgang mit digitalisierten Kulturgütern aus kolonialen Kontexten
- Author
-
Lange, Felix, Kuper, Heinz-Günter, Müller, Anja, Amrhein, Kilian, Klindt, Marco, Nowicki, Anna-Lena, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Digitalisierung ,CARE-Prinzipien ,Archivierung ,Community-Bildung ,Metadaten ,Dekolonisation ,Artefakte ,DHd2022 ,Daten - Abstract
Spätestens seit dem "Rapport sur la restitution du patrimoine culturel africain. Vers une nouvelle éthique relationnelle" von Sarr und Savoy (2018) ist die Diskussion über den Umgang europäischer Gedächtnisinstitutionen mit ihren Sammlungen aus kolonialen Kontexten neu entbrannt. Welche Bedeutung hat in diesem Zusammenhang die Digitalisierung von Objekten des kulturellen Erbes? Das Poster veranschaulicht diese Frage am Beispiel der "Ethnografica"-Sammlung im Nachlass von Karl Schmidt-Rottluff aus dem Bestand des Brücke-Museums Berlin. Diese Sammlung wird im Rahmen eines Digitalisierungs-Projekts durch das Forschungs- und Kompetenzzentrum Digitalisierung Berlin (digiS) begleitet. Um verschiedene Perspektiven auf digitale Objekte gleichberechtigt sichtbar zu machen und dabei die CARE-Regeln nicht zu missachten, untersucht digiS verschiedene technologische Ebenen. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
45. Der Einsatz von Computer Vision-Methoden für Filme - Eine Fallanalyse für die Kriminalfilm-Reihe Tatort
- Author
-
Schmidt, Thomas, Kurek, Sarah, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Multimedia ,Bilder ,Computer Vision ,Tatort ,Video ,Objekterkennung ,Programmierung ,DHd2022 ,Filmwissenschaft ,Filmanalyse ,Emotionserkennung ,Bilderfassung ,Inhaltsanalyse - Abstract
Wir präsentieren eine explorative Studie im Bereich Computer Vision (CV) und Filmanalyse. Als Fallbeispiel wird die berühmte Kriminalfilm-Reihe "Tatort" gewählt. Im Fokus stehen dabei gruppenbasierte Vergleiche zwischen den Filmen von 4 ErmittlerInnen-Teams/Städten. Als CV-Methoden werden state-of-the-art-Modelle der Objekt-, Alters-, Geschlechts- Emotions- und Ortserkennung auf Frames eines Korpus bestehend aus 13 Filmen exploriert. Die Ergebnisse zeigen, dass die Serie in den Folgen des ausgewählten Korpus eher in Innenräumen spielt, Trauer und Neutralität die häufigsten Emotionsausdrücke sind und in der Mehrzahl männliche Figuren die Frames dominieren. Obschon signifikante Unterschiede zwischen den ErmittlerInnen-Teams/Städten bestehen, sind diese gemäß Post-Hoc-Tests eher gering. Wir berichten über unsere Erfahrungen mit den ausgewählten Methoden, die Probleme mit speziellen Charakteristiken von Filmen haben und schließen mit dem Ziel in größeren Annotationsstudien Trainingsmaterial zur Optimierung von CV-Methoden zu sammeln. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
46. Digitale Texte vom Religionsfrieden bis hin zum Liebesbrief - Das Zentrum für digitale Editionen in Darmstadt stellt sich vor
- Author
-
Kalmer, Silke, Kampkaspar, Dario, Müller, Sophie, Seltmann, Melanie E.-H., Stegmeier, Jörn, Wunsch, Kevin, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Digitale Edition ,Archivierung ,Kooperation ,digitale Texte ,Annotieren ,Infrastruktur ,Projekte ,DHd2022 ,Veröffentlichung ,Kollaboration ,Transkription - Abstract
"Das Zentrum für digitale Editionen in Darmstadt (ZEiD) deckt alle Aspekte der Aufbereitung von Texten für wissenschaftliche Editionen und alle Bereiche digitaler Editionen von der Planung bis zur Veröffentlichung ab. Dabei bearbeitet es nicht nur bibliothekseigene Bestände, sondern fungiert auch als Partner für externe Projekte, etwa das Akademienprojekt "Europäische Religionsfrieden Digital" oder auch das durch das BMBF-geförderte Projekt "Gruß & Kuss". In einem Workflow von der Texterfassung (OCR) der Digitalisate über das Erstellen und Bearbeiten der XML-Grundlage bis hin zur Realisierung der digitalen Edition als Online-Präsentation wird die wissenschaftliche Erfassung der Texte garantiert und Einheitlichkeit der Texte aus verschiedenen Projekten in der Infrastruktur des Zentrums gegeben. Das Poster geht auf diesen Workflow, das verwendete Framework sowie verschiedene vom ZEiD realisierte Projekte ein." Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
47. Die Sprache der Erinnerung – analysieren und verstehen Korpuslinguistische Zugänge zu Oral-History-Daten
- Author
-
Gerstenberg, Annette, Leh, Almut, M��bus, Dennis, Pagenstecher, Cord, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Interviews ,Sprache ,Forschungsprozess ,Oral-History ,Werkzeuge ,DHd2022 ,Korpuslinguistik ,Software ,Ton ,Text - Abstract
"Oral-History-Interviews sind narrative Erinnerungsinterviews, die als Quellen bzw. Datengrundlage in unterschiedlichen Disziplinen genutzt werden. Interview-Archive sind Gedächtnisinstitution in der Bewahrung und Vermittlung von Wissensbeständen. Außerdem sind die archivierten Wissensbestände selbst Erinnerungen, also Gedächtnisinhalte. Als maschinenlesbare Daten sind Oral-History-Interviews nicht nur für die Humanities, sondern auch für Linguistik und Informatik interessante multimodale Daten. In den historischen Wissenschaften werden Oral-History-Interviews in intensiver hermeneutischer Arbeit analysiert und interpretiert, im Spannungsfeld persönlicher und kollektiver Relevanz. Die digitale Erschließung eröffnet die Möglichkeit, überindividuelle Muster der Erinnerung und ihrer sprachlichen Verfasstheit mit Hilfe korpuslinguistischer Tools zu erschließen. Auf Basis von Praxisbeispielen wird im Workshop die Frage nach dem Mehrwert technikgetriebener Analysen diskutiert. Können Tools das hermeneutische Verstehen unterstützen oder gar bereichern, oder besteht die Gefahr, die Subjektivität der Erzählung und die individuelle Entstehungssituation der Quellen aus dem Blick zu verlieren? Sind die digital erkannten Muster am Ende Artefakte oder können sie Schlüssel zum tieferen Verstehen sein?" Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
48. Der DHd Data Steward - Maßnahmen zur Entwicklung einer nachhaltigen Datenstrategie für die Digital Humanities im deutschsprachigen Raum
- Author
-
Borges, Rebekka, Debbeler, Anke, Helling, Patrick, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Data Steward ,Archvierung ,Archivierung ,FDM ,Datenstrategie ,Forschungsergebnis ,Forschungsdatenmanagement ,Publikation ,Teilen ,DHd2022 ,Veröffentlichung ,Daten - Abstract
"Mit der Ernennung eines Data Stewards hat der Verband Digital Humanities im deutschsprachigen Raum e.V. (DHd) auf der Jahreskonferenz 2020 in Paderborn eine Funktion geschaffen, um eine umfassende Datenstrategie für alle Materialien, Publikationen und Ergebnisse, die im Kontext des DHd-Verbandes entstanden sind/entstehen werden, zu entwickeln. Sie sollen im Sinne der FAIR-Prinzipien (1) langfristig gesichert und archiviert als auch (2) nach Möglichkeit nachhaltig publiziert und verfügbar gemacht werden. Mit diesem Posterbeitrag soll die bisherige Arbeit des DHd Data Stewards in Bezug auf die DHd-Jahreskonferenzen präsentiert sowie ein Blick in die Datenzukunft des Verbandes gegeben werden." Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
49. Dokument, Transkription, Forschungsdatum - Technische und kulturelle Überlegungen für interdisziplinäre Transkriptionspraxis
- Author
-
Baierer, Konstantin, Boenig, Matthias, Engl, Elisabeth, Geestmann, Mareen, Hinrichsen, Lena, Neudecker, Clemens, Pestov, Paul, Weidling, Michelle, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
Standards ,benannte Entitäten (named entities) ,Künstliche Neuronale Netze ,Transkribus ,Teilen ,UTF-8 ,OCR-D ,PAGE-XML ,OCR4all ,Kollaboration ,Handschrifterkennung ,TEI-XML ,Text ,OCR ,Metadaten ,Ground Truth ,Texterkennung ,HTR ,DHd2022 ,Unicode ,Forschungsdaten ,Transkription ,Neuronale Netze - Abstract
Wir plädieren für einen interdisziplinären Austausch, um die Transkriptionspraxis weiterzuentwickeln, sodass sie den Anforderungen verschiedener Disziplinen gerecht wird. Dazu gehen wir auf die Geschichte der Transkription als Technik ein und übertragen kulturelle sowie technische Aspekte auf digitale Methoden. Ein besonderes Augenmerk liegt auf Standards, die bei der maschinellen Verarbeitung essenziell sind und die Konventionen der analogen Transkription weiterführen. Wie eine Transkription automatisiert werden kann und welche Herausforderungen dabei bestehen, wird umrissen und es werden konkrete Empfehlungen ausgesprochen, wie sowohl bei manueller als auch bei automatischer Transkription Nachnutzbarkeit, Genauigkeit und Konsistenz sichergestellt werden können. Dabei betonen wir die Wertschätzung der Transkriptionsarbeit und wollen eine interdisziplinäre Diskussion um Konventionen und Standards anstoßen. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
50. Linked Open Tafsir - Rekonstruktion der Entstehungsdynamik(en) des Korans mithilfe der Netzwerkmodellierung früher islamischer Überlieferungen
- Author
-
Ahmed, Sajawel, Rehman, Misbahur, Tischlik, Joshua, Kruse, Carl, Mahmutovic, Edin, Özsoy, Ömer, Geierhos, Michaela, Trilcke, Peer, Börner, Ingo, Seifert, Sabine, Busch, Anna, and Helling, Patrick
- Subjects
benannte Entitäten (named entities) ,Datenerkennung ,Annotieren ,Computerlinguistik ,Programmierung ,DHd2022 ,Veröffentlichung ,Named Entity Recognition ,Daten ,Maschinelles Lernen - Abstract
Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
- Published
- 2022
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.