Am Ubiquitous Knowledge Processing (UPK) Lab der TU Darmstadt werden Software-Instrumente entwickelt, die nicht nur automatisiert Pro- und Contra-Argumente aus Texten im Internet herausfiltern, sondern sie auch einem Qualitätstest unterziehen. Dabei hilft zum Beispiel eine erfolgversprechende Trainingsdatenbank, um neue Methoden zu testen.
Mit der neuen Datenbank „UKPConvArg2“ wurde ein Instrument
geschaffen, das insgesamt 9.111 für die maschinelle Anwendung codierte
Argumenten-Paare umfasst. Die Daten stammen aus 16 Social-Media-Debatten
zu gesellschaftlich relevanten Themen. Rund 800 Crowdworker haben das
Material auf der Basis von 17 Qualitätskriterien bewertet, Fachexperten
diese Bewertung anschließend evaluiert. Die Trainingsdatenbank, die der Wissenschafts-Community seit November 2016 zur Verfügung steht, zeigt nicht nur, welche Argumente überzeugend sind
und warum. Sie bildet auch die Ausgangsbasis zur Entwicklung neuer
Methoden für die empirische Analyse von Textdaten aus dem Internet.
Keine Kommentare:
Kommentar veröffentlichen