Das
"Koordinierungsprojekt zur Weiterentwicklung von Verfahren der Optical Character Recognition (OCR)" untersucht und beschreibt
Verfahren der automatischen Texterkennung. Es werden zum einen Konzepte für optimale Workflows erarbeitet. Zum anderen soll eine Standardisierung von OCR-bezogenen Prozessen und deren Metadaten erreicht werden. Eines der wesentlichen Ziele ist die konzeptionelle Vorbereitung der vollständigen Transformation des gedruckten deutschen Kulturerbes (16. bis 19. Jahrhundert) in eine maschinenlesbare Form.
Durchgeführt wird das Projekt von der Herzog August Bibliothek Wolfenbüttel, von der Berlin-Brandenburgischen Akademie der Wissenschaften, dort im Besonderen durch das Deutsche Textarchiv (DTA), sowie von der Bayerischen Staatsbibliothek München unter Beteiligung von Experten, Wissenschaftlern und Bibliothekaren. Das Projekt startete am 01.09.2015 und wird von der DFG gefördert.
Weitere Informationen zu dem Projekt: http://www.ocr-d.de/
Keine Kommentare:
Kommentar veröffentlichen