News

Open source at CCeH in 2016

Welcome to the annual CCeH report on our contributions to the open source world!

We at the Cologne Center for eHumanities always turn to open source software for our DH projects. Not only because they are free (as in beer) and free (as in speech) but also because of the marvelous communities that have formed around many of these free and open source projects. Our way to say thank you to these communities is to give back to their projects.

In 2014 we started a conscious effort to develop in the open and be good open source citizens. In 2015 we reported on our first contributions to the free software components that we use in our projects. We are happy to report in 2016 CCeH has contributed even more and to many more projects.

Our own DH projects

The number of projects that are available on our GitHub space https://github.com/cceh has grown a lot in 2016.

Some of the project repositories we published in the last year:

We are also setting up a GitLab installation to better integrate collaborators from other universities, private foundations and research partners. Stay tuned for more news on this front.

Improvements to other projects

Sometimes a program does 99% of what we need. Instead of just complaining about the missing 1%, we do our best to contribute the missing functionalities or fixing some incorrect behavior. Contributing with improvements to open source projects is also as a sign of gratitude towards the volunteers that work daily to improve and to maintain it.

During 2016 we contributed to the collation tool CollateX, fixing some subtle errors and making it work better in UNIX workflows.[1,2,3] We also provided patches to make the eXist XML database understand and process correctly the unconventional range of dates used in Archeology.[4,5]

We also contributed small improvement to the Rack web server[6,7] and the W3C Web Audio specifications.[8]

Bug reports

Nobody is perfect. Every software has a problem or two. In case we stumble upon one of these problems, we go at great lengths to report it in the best way possible, spending time to understand its root cause and to gather all the details that the maintainers of the project will need to fix the problem.

In 2016 we reported many conformance and performance issues to the widely used eXist XML database.[9,10,11,12,13,14] In another XML database we use, BaseX, we pointed out some possible improvement to the way it is run on servers.[15,16]

Big and well-known projects are not outside our radar. For example, we have found out and reported that Wikipedia was involuntarily producing pages that were not well formed XHTML and could not be analyzed using standard XML tools.[17] Thankfully that has been fixed in a couple of days.

It is nice to observe how our bug reports reflect the technologies predominately used at the CCeH: XML and TEI[18], web servers[19], browsers [20] and WordPress[21].

2016 has been a fulfilling year. We will strive to make 2017 even better.

Neue Heimat für Critical Pāli Dictionary

Pali Dictionary

Pali (Pāli) ist eine mittelindische Literatursprache. Zusammen mit dem eng verwandten Sanskrit (siehe Cologne Sanskrit Lexicon) ist Pali die wichtigste Sakralsprache des Buddhismus. Der in Pali verfasste frühbuddhistische Tripiṭaka-Kanon bildet den zentralen textuellen Kern der buddhistischen Lehre.

Das (digitale) Critical Pāli Dictionary wird fachlich von der Pali Text Society betreut. Das Lexikon ist über eine lange Zeit an der dänischen Akademie in Kopenhagen unterstützt und als online-Lexikon seit 2004 unter http://pali.hum.ku.dk/cpd/ angeboten worden. Mit dem Ende des Hostings in Kopenhagen brauchte es eine Heimat. In Zusammenarbeit mit dem Institut für Linguistik (IfL) und dem Data Center for the Humanities (DCH) hat das CCeH diesen Umzug nun vollzogen. Das Wörterbuch ist jetzt unter

http://cpd.uni-koeln.de/

erreichbar. Dabei ist zu beachten, dass dies nur ein erster kleiner Schritt ist, bei dem es zunächst ausschließlich um die Bewahrung und dauerhafte Zugänglichkeit einer fachwissenschaftlich relevanten Ressource geht. Es wurden deshalb keinerlei inhaltliche oder funktionale Änderungen gegenüber der schon etwas in die Jahre gekommenen Anwendung vorgenommen.

Marcello Perathoner (CCeH, Umsetzung), Felix Rau (IfL, fachliche Koordination), Jonathan Blumtritt (DCH, Dauerbetrieb), Patrick Sahle (CCeH, Koordination)

CCeH kooperiert mit Itinera Nova (Stadtarchiv Löwen)

 

Schöffenregister von 1367
Schöffenregister von 1367

Register 8114, Folio 2v
Register 8114, Folio 2v

Seit 2009 digitalisiert, erschließt und transkribiert das Stadtarchiv Löwen mit einer Gruppe lokaler Freiwilliger im Projekt Itinera Nova die Löwener Schöffenprotokolle: Eine Quellenreihe, die über die Jahre 1362 bis 1795 beeindruckende 1128 Bände mit rund 300.000 Seiten umfasst. Das Projekt ist ursprünglich zusammen mit der Kölner Historisch-Kulturwissenschaftlichen Informationsverarbeitung (Prof. Manfred Thaller) entwickelt worden und wird nun vom CCeH weiter begleitet. Dabei geht es aktuell zunächst um den Abschluss der Digitalisierung, die Fortsetzung der Transkription sowie neue Ansätze zur Tiefenerschließung und zur wissenschaftlichen Auswertung. Über die nächsten sechs Jahre schließt sich außerdem als neues Teilprojekt die Digitalisierung und Erschließung der Löwener Rechnungsbücher an: 450 bis zu 25cm dicke Bände von 1345 bis 1795.

MOMathon ging in die dritte Runde

Mehr als 150 Urkunden bei dem MOMathon bearbeitet

Am 15. November 2016 fand der dritte MOMathon als Online-Event statt.

In der Zeit von 10-22h wurden die Benutzer aufgerufen vorher definierte Aufgaben auf der monasterium-Plattform zu erledigen. So wurden die Teilnehmer unter anderem gebeten Datumsangaben in den ausgewählten Urkunden zu korrigieren oder sogar selbstständige Abstracts oder Transkriptionen anzufertigen. Um den Qualitätsstandard möglichst hoch zu halten, werden nach Abschluss des Events alle Änderungen einer Kontrolle durch das Moderatorenteam unterzogen. Hierbei hat sich gezeigt, dass durchweg eine präzise und gehaltvolle Ergänzung des Bestandes vorgenommen worden ist.

Facts:

  • 34 Teilnehmer aus Deutschland, Österreich, Rumänien, Italien, Spanien und Großbritannien
  • 155 insgesamt bearbeite Urkunden

Weitere Informationen:
co:op-Blog

Hinweise zu zukünftig stattfindenden MOMathons entnehmen Sie bitte http://www.monasterium.net/mom/home.


Der MOMathon-Event als auch die Plattform Monasterium.net sind Partner des europäisch geförderten “co:op” (Community as Opportunity)-Projektes (http://coop-project.eu/). Insgesamt haben sich 17 Organisationen aus 11 unterschiedlichen Nationen zusammengeschlossen. Die Koordinierung hat das Hessische Staatsarchiv Marburg übernommen.

Monasterium.net (http://monasterium.net) ist eine international ausgerichtete Online-Plattform für Urkunden des Mittelalters und der Frühen Neuzeit. Als eines dergrößten online verfügbaren Portale weist Monasterium.net zurzeit über 600.000 Urkunden aus 157 europäischen Archiven aus dem vornehmlich zentral- und osteuropäischen Raum auf. Die Nutzung des Portals ist kostenfrei und für jede Person möglich.

“Klang der Sterne” – Cultural Data Installation bei Coding Da Vinci Nord ausgezeichnet

Unter Beteiligung von CCeH-Mitarbeiter Andreas Mertgens wurde im Rahmen des Kulturdaten-Hackathons “Coding da Vinci Nord” im Oktober 2016 die Installation “Klang der Sterne” realisiert und mit dem Preis “Unusual Use of Data” ausgezeichnet.
Das Projekt basiert auf der Datenbank Applause des Leibniz-Institut für Astrophysik Potsdam, in der sich Digitalisate und Daten mehrerer tausend historischer astronomischer Photoplatten aus den Jahren 1909-1979 befinden.
Das Projekt “Klang der Sterne” nahm sich zum Ziel, diese Daten als kulturelle und historische Artefakte im Rahmen einer audio-visuellen Installation darzustellen. Die auf den Platten gemessenen und in der Datenbank vorliegenden Helligkeitswerte von zwei, von Sternwarte Hamburg aus beobachteten Doppelsternen bilden die Grundlage für eine mehrspurige Klanginstallation (realisiert mit Sonic Pi), die von einer Animation der entsprechenden Photoplatten ergänzt wird. Als Anspielung auf die historische Natur der Daten wurde diese Installation mit Hilfe eines Raspberry Pi in einem Radio aus der 60er Jahren verbaut, mit dessen Knöpfen sich auch die einzelnen Tonspuren hinzuschalten lassen.
Weitere Arbeiten am Projekt sind geplant.
Klang der Sterne Radio

Team

Sandra Trostel @filmgizmo
Andreas Mertgens@amertgens
Matthias Müller-Prove @mprove
Boris Crismancich @crismancich

Alle weiteren Infos auf https://hackdash.org/projects/57dd6265d9284f016c047469

Digital Humanities @ Uni Köln – Broschüre zum Überblick

Eine neue Broschüre des CCeH gibt einen Überblick zu allen Aspekten der Digital Humanities an der Universität zu Köln. Auf 80 Seiten werden institutionelle Einheiten und Strukturen, die Lehrprogramme und eine Vielzahl von Projekten aus den DH im engeren und weiteren Sinne vorgestellt.

Die Publikation wurde von der Nordrhein-Westfälischen Akademie der Wissenschaften und der Künste unterstützt.

Alle Informationen, sowie Download Links finden Sie auf http://cceh.uni-koeln.de/broschure-digital-humanities-2016

Druckexemplare können ebenfalls angefordert werden: info-cceh@uni-koeln.de

Workshop “Topic Modeling”

Workshop “Topic Modeling”

ReferentInnen:
Ulrike Henny (ulrike.henny@uni-wuerzburg.de) und
Christof Schöch (christof.schoech@uni-wuerzburg.de)

CCeH, Universität zu Köln, in Kooperation mit DiXiT

Termin: 9.12.2016 von 9:00-17:30, Besprechungsraum des CCeH (Universitätsstraße 22, Dachgeschoss rechts)

Kurzbeschreibung

Topic Modeling ist eine quantitative Methode der Textanalyse, die zum Ziel hat, einen Zugriff auf (im weitesten Sinne) inhaltliche Muster in umfangreichen Textsammlungen anzubieten. Um Topic Modeling mit eigenen Textdaten durchzuführen, sind drei wesentliche Schritte notwendig: Erstens das Vorbereiten der Texte und Metadaten für die Analyse; zweitens der eigentliche Vorgang des Topic Modelings, d.h. der Extraktion von Struktur in den Daten; und drittens die Aufbereitung und Visualisierung des Modells in einer Form, die eine Interpretation der Ergebnisse erlaubt. Ziel des Workshops “Topic Modeling” ist es, die TeilnehmerInnen in die Lage zu versetzen, den vollständigen Arbeitsablauf für das Topic Modeling am eigenen Rechner und mit eigenen Textdaten durchzuführen.

Vorbereitung und praktische Voraussetzungen:

Wir empfehlen die vorbereitende Lektüre des folgenden Beitrags zu den Grundlagen von Topic Modeling:
David Blei, “Probabilistic Topic Models”, 2012: https://www.cs.princeton.edu/~blei/papers/Blei2012.pdf.

Wir bitten alle TeilnehmerInnen, ihren eigenen Laptop mitzubringen und vor der Veranstaltung Python3 (aktuelle Version, mindestens aber 3.4) einschließlich der Pakete numpy, pandas, matplotlib, scipy, seaborn und wordcloud zu installieren. Bei Problemen mit der Installation bitten wir darum, uns vorab zu kontaktieren. Programmierkenntnisse sind hilfreich, aber nicht erforderlich. Wir werden vorbereitete Textsammlungen in verschiedenen Sprachen für die Durchführung des Topic Modeling anbieten, bei Interesse können die TeilneherInnen auch mit eigenen Daten arbeiten.
Benötigt werden möglichst viele Dokumente im Volltext (einfache Textdateien) und Metadaten zu den Texten in tabellarischer Form (z. B. im Format CSV) mit Angaben wie ID des Textes, AutorIn, Erstellungsjahr, usw., je nach Erkenntnisinteresse.

Programm:

Folien

09:00-10:30: Vorstellungsrunde, inhaltliche Einführung, Installation

10:30-11:00: Kaffeepause

11:00-13:00: Workflow I: Preprocessing & Topic Modeling

13:00-14:00: Mittagspause

14:00-15:30: Workflow II: Visualisierung

15:30-16:00: Kaffeepause

16:00-17:30: Diskussion von Ergebnissen & Ausblick

etwa 17:30: Ende der Veranstaltung

Teilnehmerzahl ist begrenzt
Anmeldungen und Rückfragen an info-cceh@uni-koeln.de

Niklas-Luhmann Archiv bei der Veranstaltungsreihe “Basis Zwei”

Am Samstag, dem 29.10.2016 um 14 Uhr werden Johannes Schmidt von der Soziologischen Fakultät der Universität Bielefeld mit Martina Gödel und Sebastian Zimmer vom CCeH im Rahmen der Veranstaltungsreihe “Basis Zwei” einen Vortrag über die konzeptionellen und technischen Herausforderungen der Erschließung von Niklas Luhmanns Zettelkasten halten.

Abstract

Martina Gödel, Johannes Schmidt, Sebastian Zimmer – Niklas Luhmanns Zettelkasten: ein “preadaptive advance” digitaler Datenbanken?

Der bedeutende Soziologe Niklas Luhmann entwickelte im Laufe seiner 25-jährigen Forschungstätigkeit an der Universität Bielefeld eine universale Sozial- und Gesellschaftstheorie, die er in etwa 50 Büchern und 500 Aufsätzen publiziert hat. Als Basis für diese erstaunliche Produktivität diente Luhmann ein Zettelkasten, den er über vierzig Jahre lang systematisch gefüllt und gepflegt hat. Diese Sammlung von 90.000 Notizzetteln ist durch vier Merkmale gekennzeichnet: eine nicht-hierarchische Ordnungsstruktur, ein damit zusammenhängendes spezifisches Nummerierungssystem der Zettel, ein Verweisungsprinzip, das die Notizen untereinander und quer durch die Zettelsammlung vernetzt, sowie ein mehrere tausend Begriffe umfassendes Schlagwortregister.
Im Zuge der Nachlasserschließung werden die Zettel zunächst digitalisiert, in einem zweiten Schritt transkribiert und fachwissenschaftlich editiert. Ziel dieses Prozesses ist eine Reproduktion der Sammlung, die die Möglichkeiten der modernen digitalen Technik nutzt, um sie lesbar und ihre Genese nachvollziehbar zu machen. Das Projekt ist aufgrund der Masse und der Heterogenität des Materials sowie des datenbanksimulierenden Ansatzes des Luhmannschen Zettelkastens nicht nur fachwissenschaftlich, sondern auch technisch eine Herausforderung.
Als Basis für die digitale Präsentation des Zettelkastens werden hochstrukturierte XML-Dateien erstellt, die die Möglichkeit bieten, den transkribierten Text mit Informationen anzureichern. Jeder Zettel wird semantisch als freie, einzelne Gedankeneinheit begriffen, die in Verbindung mit anderen Einheiten steht. Implizit enthaltene Informationen werden durch Zettel-IDs und Schlagwortregisterverlinkungen explizit gemacht. Darüber hinaus soll der Nutzer auch die Zettelreihungen nachvollziehen können und so z.B. Auffälligkeiten wie Konzentrationen, aber auch ‚schwarze Löcher‘ im Zettelbestand für ihn sichtbar werden. Das von Luhmann nicht im Detail und im Voraus geplante Wachstum der Sammlung wird so in seinem ganzen Ausmaß transparent und die Gedankenentwicklung nachvollziehbar. Neben einer Arbeitsoberfläche, die es Fachwissenschaftlern ohne tiefere Technologiekenntnisse erlaubt, weiterführend mit dem Zettelkasten zu arbeiten, werden die Daten im weiteren Verlauf der Nachlasserschließung im Projektportal veröffentlicht.
Ziel des Vortrags ist, den Bestand und die Funktionalität des von Luhmann hinterlassenen Zettelkastens zu beschreiben, um dann in einem zweiten Schritt jenes Vorhaben der Digitalisierung genauer darzustellen.

Die Veranstaltungsreihe Basis Zwei

Digitaltechnik – Kunst – Denken
Eine transdisziplinäre Veranstaltungsreihe

Hannover, 01.10. – 24.11.2016

Die Digitaltechnik bringt tiefgreifende Wandlungen auch der Kunst-, Musik- und Wissensproduktion mit sich. Die transdisziplinäre Veranstaltungsreihe Basis Zwei fragt nach den Zusammenhängen: Welche neuen Möglichkeiten eröffnet der Computer, welche Herausforderungen stellt er etwa im Bereich der Komposition, der Musikproduktion oder in den Geisteswissenschaften? Inwieweit formt der Computer als Modell und als Werkzeug zur Simulation unser Bild der Welt?

Weiterführende Links

Basis Zwei Homepage
Basis Zwei Programmheft
Details zum Vortrag

Renaissance Women Writers in Italy and Germany – CCeH researcher Tiziana Mancinelli funded by NetEx program

A Digital Scholarly Edition of Renaissance Women Writers in Italy and Germany

We are pleased to announce that Dr. Tiziana Mancinelli (CCeH) and Dr. Anna Cappellotto (University of Verona) have been awarded a research grant within the programme Network & Exchange – NetEx, a measure of the Female Professors Programme II at the University of Cologne.

The funded project aims at exploring the role, in/visibility, and position of women writers in Italian and German Literature during the Renaissance from a cross-cultural perspective, in both print and digital scholarly editions. We propose an inclusive, case study based approach, which asks questions from a gender perspective about the process of the realisation of digital archives and Digital Humanities Scholarships. By investigating a corpus of works written by women about their status and roles and by engaging in a literary and philological analysis, we will look at the hierarchical structure of hegemonic power in the field of social discursive practices.

In order to examine the various aspects and features of a cross-cultural and gender gaze throughout the Renaissance, the project will collect, systematize and explore the contribution of women writers in Germany and Italy. We will consider the works of Italian women such as Vittoria Colonna (1492-1547), Veronica Gambara (1485-1550) Gaspara Stampa (1524-1554), and Veronica Franco (1546-1591), who, as courtesans and gentildonne, made an original contribution to the Italian Renaissance, from poetry to the epistolary genre.

While in Italy courtesans had a prominent role in literary production, in Germany Caritas Pirckheimer (1467-1532) represented the typology of virgo docta. The abbess had a lengthy correspondence with contemporary leading humanists; in addition, she wrote a chronicle of events which took place at her monastery, which conveys an extremely vivid image of the history of the Reformation. Moreover, the public and private correspondence written by Margaret of Austria (1480-1530) will be included in the project to explore the writing of a well-educated noblewoman and patron.

In conclusion, with the expertise and support of the CCeH and IDE, this project will deal with both technical (infrastructures, annotation, workflow) and theoretical issues in order to challenge the dominant paradigm, through the metadata curation and the categories used for it. It will also question how categories could contribute to the construction of socio-cultural identities and the literary canon.

Do not hesitate to contact us for further information! Anyone interested in the subject is encouraged to send enquiries, contributions and suggestions to:

Dr. Tiziana Mancinelli (University of Cologne) email: tiziana.mancinelli@uni-koeln.de

Dr. Anna Cappellotto (University of Verona) email: anna.cappellotto @univr.it

(Image: Vittoria Colonna, Ritratto di Michelangelo, c. 1550, British Museum, London; from Wikimedia Commons)