Vortrag Prof. Martin Volk, “Das Text+Berg-Korpus: Aufbau und Anwendungen”

Das Institut für Linguistik, Abt. Sprachliche Informationsverarbeitung (Prof. Dr. Jürgen Rolshoven) lädt zu folgendem Vortrag ein:

Montag, 31.01.2011, 14.00 Uhr – 15.30 Uhr

Prof. Dr. Martin Volk (Zürich):

“Das Text+Berg-Korpus: Aufbau und Anwendungen”

Der Vortrag findet im Philosophikum im VL-Computerpool statt.

Abstract:
Das Projekt “Text+Berg” (www.textberg.ch) erschließt seit 2008 alpinistische Texte. In der ersten Phase wurden Publikationen des Schweizer Alpen-Clubs (SAC) digital erfasst und korpuslinguistisch aufbereitet. Das “Jahrbuch des S.A.C.” (1864–1923), das “Echo des Alpes” (1872-1923), und “Die Alpen” (1925–heute) sind eine wertvolle und umfangreiche Sammlung von Berichten, Aufsätzen und Reflexionen über den Alpinismus sowie über Kultur und Natur des Alpenraumes. Durch die zeitliche Kontinuität, in der die Reihen erschienen sind, stellen sie eine einzigartige, mehrsprachige Textbasis dar, um historische, kulturwissenschaftliche aber gerade auch sprachwissenschaftliche Fragestellungen zu beantworten.
Der Vortrag beleuchtet einerseits die Schritte zur Erstellung und Annotation des Korpus. Dies umfasst Texterkennung (OCR), automatische Korrektur von OCRFehlern, Sprachidentifikation pro Satz, Auszeichnung mit Meta-Informationen, sowie die Erkennung von geographischen Bezeichnungen (Toponymen). Andererseits werden die Analyseergebnisse zu auffälligen Sprachmustern in verschiedenen Epochen ausgewertet und gezeigt, wie das Korpus für verschiedene Fragestellungen verwendet werden kann.