CCeH: an ELEXIS Observer

We are glad to announce that the Cologne Center for eHumanities (CCeH) is an Observer institution in ELEXIS, the European Lexicographic Infrastructure, a Horizon 2020 project. ELEXIS is an ambitious project whose ultimate goal is to create a common working platform for lexicographers and publishers of lexical data. ELEXIS also aims at bridging the technical gap between the different communities involved in the project. The main beneficiaries will be dictionary users, both ‘normal’ users as well as researchers that will have access to an unparalleled amount of interconnected lexical data.

The project has different working packages, which range from creating a common data model, the ELEXIS data model; to extract lexical data from digitized printed dictionaries in PDF format; or to create digital dictionaries from scratch via Lexonomy, a cloud-based dictionary writing system. At the core of the technical infrastructure is the Dictionary Matrix, developed by John P. McCrae and his team from NUI Galway, that will link both monolingual and bilingual dictionaries at headword and sense level. All these resources will be accessible through a REST API. Therefore, they will be available for being employed by multiple applications, such as natural language processing (NLP) applications, desktop clients, mobile applications, etc. 

What is the role of the CCeH in ELEXIS?

The University of Cologne has a rich tradition in digitizing and hosting South Asian language resources. The CCeH will provide its Sanskrit dictionaries to ELEXIS. The main platform for Sanskrit dictionaries worldwide is the Cologne Sanskrit Digital Dictionaries portal. This project was started in 1994 by Thomas Malten when Unicode and XML did not exist. In 2003 began conversion into XML format and in 2015 the Lazarus Project was initiated with the goal of converting the most complex dictionaries into TEI-P5 and also to create a common TEI schema for them. These dictionaries are available via the C-SALT APIs for Sanskrit Dictionaries and we offer for each dictionary a GraphQL and a REST API. These APIs have been created and maintained with Kosh, a framework developed by the CCeH and the Data Center for the Humanities. Kosh offers a state-of-the-art technology stack that can be employed to create and maintain APIs for any XML-encoded dictionary.

We are very happy to be part of the ELEXIS community and thus share resources and knowledge with the most important lexicographic project worldwide!

Contact:

Francisco Mondaca (f.mondaca@uni-koeln.de)

Felix Rau (f.rau@uni-koeln.de)


CCeH @DHd2018

Dieses Jahr findet die DHd-Konferenz “Kritik der digitalen Vernünft” vom 26. Februar bis zum 2. März 2018 an der Universität zu Köln statt.

Die Mitarbeiterinnen und Mitarbeiter des CCeH, des frisch gegründeten Instituts für Digital Humanities, des Data Center for the Humanities, prometheus und anderer Einrichtungen der Universität zu Köln geben ihr Bestes, um diese Konferenz zu einer erinnernswerten Veranstaltung zu machen. Einige aktuelle und ehemalige Mitarbeiter und Mitarbeiterinnen sind mit eigenen Beiträgen vertreten.

Workshops:

Jonathan Blumtritt und Felix Rau: “Nutzerunterstützung und neueste Entwicklungen in Forschungsdatenrepositorien für audiovisuelle (Sprach-)Daten” (Di., 27.01., 09:00-10:30).

Patrick Sahle trägt bei zum Workshop „Zur Zukunft der Digitalen Briefedition – kooperative Lösungen im kulturwissenschaftlichen Forschungsdatenmanagement“ (Di., 27.01., 14:00-15:30)

Panels:

Frederike Neuber, Ulrike Henny-KrahmerPatrick Sahle und Franz Fischer organisieren das Panel “Alles ist im Fluss” und diskutieren mit Rüdiger Hohls, Anne Baillot, Christof Schöch und Jürgen Hermes über Ressourcen und Rezensionen in den Digital Humanities. Die Idee zur Einreichung geht auf die herausgeberische Arbeit an der Online-Rezensionszeitschrift RIDE zurück. (Mi., 28.02., 14:00-15:30).

Patrick Sahle diskutiert mit Katrin Moeller, Matej Ďurčo, Marina Lemaire, Lukas Rosenthaler, Ulrike Wuttke und Jörg Wettlaufer: “Die Summe geisteswissenschaftlicher Methoden? Fachspezifisches Datenmanagement als Voraussetzung zukunftsorientierten Forschens” (Do., 01.03., 16:00-17:30).

Vorträge:

Gioele Barabucci: “Funktionale und deklarative Programmierung-basierte Methode für nachhaltige, reproduzierbare und verifizierbare Datenkuration” (Fr., 02.03., 09:00-10:30).

Ulrike Henny-Krahmer, Katrin Betz, Daniel Schlör und Andreas Hotho: “Alternative Gattungstheorien: Das Prototypenmodell am Beispiel hispanoamerikanischer Romane” (Do., 01.03., 9:00-10:30).

Martina Bürgermeister, Gerlinde Schneider, Stephan Makowski, Daniel Jeller, Jan Bigalke, Christian Theisen und Georg Vogeler: “Software Aging in den DH: Kritik des reinen Forschungswillen” (Fr., 02.03.,  9:00-10:30).

Poster (Do., 01.02., 17:45-19:15):

Ben Bigalke, Ulrike Henny-Krahmer, Sviatoslav Drach, Pedro Sepúlveda, Christian Theisen: “Personen- und Figurennetzwerke in Fernando Pessoas Publikationsplänen”.

Jonathan Blumtritt, Uwe Breitenbücher, Simone Kronenwett, Frank Leymann und Brigitte Mathiak: “SustainLife – Erhalt lebender, digitaler Systeme für die Geisteswissenschaften”.

Franz Fischer, Greta Franzini und Mike Kestemont: “Digital Medievalist: A Web Community for Medievalists working with Digital Media”.

Christian Forney, Antonio Rojas Castro, Peter Dängeli: “Von der geschlossenen Forschungsdatenbank zur offenen Editions- und Forschungsplattform”.

Francisco Mondaca, Jürgen Rolshoven, Philip Schildkamp und Andreas Vogt: “Syndred – A Syntax-Driven Editor for Lexical Resources”.

Uta Reinöhl, Daniel Kölligan, Börge Kiss, Claes Neuefeind, Francisco Mondaca und Patrick Sahle: “VedaWeb – eine webbasierte Plattform für die Erforschung altindischer Texte”.

 

Der Rigveda wird bald Vedaweb

Der Rigveda, im altindischen Sanskrit verfasst, stellt eines der zentralen, wenn nicht das wichtigste, Datenkorpus der Indogermanistik bzw. Historisch-Vergleichenden Sprachwissenschaft dar. Dieses Korpus zeichnet sich sowohl durch seine große Zeittiefe – die ältesten Schichten stammen aus dem späten zweiten Jahrtausend vor Christus – als auch durch seinen großen Umfang aus.

Das Vedaweb-Projekt hat zum Ziel, eine virtuelle Forschungsumgebung zu entwickeln, in der der Rigveda vollständig digital sowie in linguistisch vorannotierter Weise zugänglich gemacht und der Forschungsgemeinschaft zur Weiterbearbeitung und Analyse zur Verfügung gestellt wird. Eine Besonderheit bildet dabei die Verknüpfung jedes einzelnen Wortelements mit den Lemmata der in Köln angesiedelten digitalen Sanskritwörterbücher (alte / neue Installation), was den qualitativen Sprung in der linguistischen und kulturwissenschaftlichen Erforschung unterstützt.

Die komplette morphologische Annotation des Rigvedas wird von Prof. Dr. Paul Widmer und Dr. Salvatore Scarlata von der Universität Zürich zur Verfügung gestellt.

Das Projekt wird flankiert von Bestrebungen, digitale Sprachressourcen zu Südasien an der Universität zu Köln neu zusammenzuführen. Unter dem Namen C-SALT (Cologne South Asian Languages and Texts Portal) sollen hier lexikalische Hilfsmittel (wie das Critical Pāli Dictionary) sowie Texte und Korpora versammelt und besser zugänglich gemacht und ggf. mit dem Vedaweb verbunden werden.

Mehrere Einrichtungen der Philosophischen Fakultät der Universität zu Köln sind im Projekt beteiligt: Die Allgemeine Sprachwissenschaft und die Historisch-Vergleichende Sprachwissenschaft sind für die Datenaufbereitung zuständig. Das CCeH übernimmt die TEI-Modellierung des Korpus und verwandter Ressourcen. Die Webapplikation wird von der Sprachliche Informationsverarbeitung entwickelt. Die Archivierung und Nachhaltigkeit der Daten wird schließlich vom Data Center for the Humanities (DCH) gewährleistet.

Projektteam Vedaweb 

(Einrichtungen sind alphabetisch sortiert)

Allgemeine Sprachwissenschaft, Institut für Linguistik

Dr. Uta Reinöl

Felix Rau

Jakob Halfmann

Cologne Center for eHumanities

Prof. Dr. Patrick Sahle

Francisco Mondaca

Data Center for the Humanities

Jonathan Blumtritt

Historisch-Vergleichende Sprachwissenschaft, Institut für Linguistik

PD Dr. Daniel Kölligan

Natalie Korobzow 

Sprachliche Informationsverarbeitung, Institut für Linguistik

Prof. Dr. Jürgen Rolshoven

Claes Neuefeind

Börge Kiss

Laufzeit:

Juli 2017- Juli 2020

vorläufige Projektseite am Institut für Linguistik

Das Projekt Vedaweb wird gefördert von der