Dienstag, 20. Dezember 2016

Neue Tools analysieren Qualität von Texten im Internet

Am Ubiquitous Knowledge Processing (UPK) Lab der TU Darmstadt werden Software-Instrumente entwickelt, die nicht nur automatisiert Pro- und Contra-Argumente aus Texten im Internet herausfiltern, sondern sie auch einem Qualitätstest unterziehen. Dabei hilft zum Beispiel eine erfolgversprechende Trainingsdatenbank, um neue Methoden zu testen. 

Mit der neuen Datenbank „UKPConvArg2“ wurde ein Instrument geschaffen, das insgesamt 9.111 für die maschinelle Anwendung codierte Argumenten-Paare umfasst. Die Daten stammen aus 16 Social-Media-Debatten zu gesellschaftlich relevanten Themen. Rund 800 Crowdworker haben das Material auf der Basis von 17 Qualitätskriterien bewertet, Fachexperten diese Bewertung anschließend evaluiert. Die Trainingsdatenbank, die der Wissenschafts-Community seit November 2016 zur Verfügung steht, zeigt nicht nur, welche Argumente überzeugend sind und warum. Sie bildet auch die Ausgangsbasis zur Entwicklung neuer Methoden für die empirische Analyse von Textdaten aus dem Internet.

Keine Kommentare: