Donnerstag, 23. April 2015

Kurationsprojekt für computerlinguistische Forschungen am Textkorpus des DDR-Zeitungsportals

Im Rahmen eines DFG-Projekts wurden die drei DDR-Tageszeitungen Neues Deutschland, Berliner Zeitung und Neue Zeit für einen Erscheinungszeitraum von fast 50 Jahren digitalisiert. Dieser Zeitraum umfasst die Sowjetische Besatzungszone, die gesamte Zeit der DDR und reicht bis in die ersten Jahre nach der Wiedervereinigung. Die einige Millionen Begriffe umfassenden Daten über diesen historisch interessanten Zeitraum ergeben einen Textkorpus, der im Rahmen der Digital Humanities hervorragend für computerbasierte Untersuchungen geeignet ist. Im Projekt „Kuration des DDR-Presseportals und Evaluierung der CLARIN-D-Services als Grundlage für die zeithistorische Forschung“ dient der Textkorpus der drei Tageszeitungen als Forschungsobjekt für computerlinguistische Analysen. Dieses Projekt wird in Kooperation mit der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW), dem Institut für Geschichts- wissenschaften, Bereich Historische Fachinformatik der Humboldt-Universität Berlin und dem Zentrum für Zeithistorische Forschung Potsdam (ZZF) durchgeführt.

Innerhalb von CLARIN (Common Language Resources and Technology Infrastructure), einem europaweiten Netzwerk, wird eine nachhaltige webbasierte Forschungsinfrastruktur insbesondere für die Geistes- und Sozialwissenschaften aufgebaut. CLARIN-D ( = CLARIN in Deutschland: http://www.clarin-d.de/de/) verfügt mit „WebLicht“ über ein computerlinguistisches Tool, das für verschiedene Anwendungsgebiete evaluiert werden soll. Für die Zeitgeschichte wird dies der Textkorpus der drei DDR-Zeitungen sein. Um die Daten für computerlinguistische Untersuchungen verwendbar zu machen, werden sie von der BBAW umformatiert und in das Digitale Wörterbuch der Deutschen Sprache (DWDS) in die Zeitungskorpora des 20. Jahrhunderts aufgenommen. Danach werden im Rahmen des Forschungsschwerpunktes des ZZF zur Historischen Semantik des Politischen im 20. Jahrhundert Worthäufigkeiten, Neologismen und Wortprofile der DDR-Sprache in ihren Entwicklungen als auch Sprachtransfers zwischen Ost- und Westsprache im Vergleich mit der Wochenzeitung Die Zeit untersucht. Das Projekt wurde im Januar 2015 bewilligt und soll Ende 2015 abgeschlossen sein (nach: Monatsbericht der Staatsbibliothek zu Berlin für den Monat März 2015).

Keine Kommentare: