Suchen

500.000 Euro von der Deutschen Forschungsgemeinschaft für Sprachanalyse Computer könnten in Zukunft zwischen den Zeilen lesen

| Autor / Redakteur: Christoph Kurth / Nico Litzel

Forscher arbeiten daran, dass Computer künftig den Sinn von Texten besser verstehen können und sogar in der Lage sind, Wortwitz oder Ironie zu erkennen.

Firmen zum Thema

Dr. Michael Wiegand von der Universität des Saarlandes.
Dr. Michael Wiegand von der Universität des Saarlandes.
(Bild: Universität des Saarlandes)

Dr. Michael Wiegand von der Universität des Saarlandes versucht dem Computer beizubringen, Meinungen, Stimmungen und Gefühle aus Äußerungen herauszulesen. Unterstützung bekommt die Saar-Universität dabei von der Universität Hildesheim. Die Forschung wird von der Deutschen Forschungsgemeinschaft (DFG) mit einer Summe von 500.000 Euro gefördert. Etwa die Hälfte davon geht an die Universität im Saarland.

Die Information hinter dem Wort

Gemeinsam versuchen die Sprachforscher, verschiedene Analyseverfahren zu kombinieren, um den Computer mit Informationen zu füttern, die hinter den Wörtern und Sätzen stecken. Beispielsweise scheitern bislang Computer an einer Aussage wie „Das hat ja super geklappt!“, die oft auch im ironischen Sinne verwendet wird, wenn alles schief gegangen ist.

Bislang werden Sentimentanalysen verwendet. Bei diesen zählen Analyseprogramme die Anzahl bestimmter Wörter im Text um zu schätzen, ob dieser eher positiv oder negativ ist. Wiegand und seine Kollegen hingegen konzentrieren sich auf den einzelnen Satz. Sie ermitteln, ob zum Beispiel mit den gewählten Worten das Gegenteil gemeint ist und bereiten die Information dann für den Computer auf.

Herangehensweise der Forscher

Die Sprachforscher erstellen dazu zunächst eine Textsammlung von Hand. Hier werden den einzelnen Wörtern Bedeutungen zugeteilt. Beispielsweise werden dem Wort „dumm“ Informationen hinterlegt, die dem Computer verständlich machen, dass es hier um eine Wertung geht. Die Forscher versuchen diesen manuellen Ablauf zu automatisieren. Die Ergebnisse des automatisierten Verfahrens werden am Ende mit der anfangs erstellten Textsammlung verglichen, um herauszufinden, ob der Computer den Text richtig analysiert hat.

Ihre Ergebnisse wollen die Sprachtechnologen als lexikalische Ressource – also als eine Art „Wörterbuch“ für künftige computerlinguistische Forschung – zur Verfügung stellen. Das Projekt ist auf drei Jahre angelegt.

Artikelfiles und Artikellinks

(ID:43239245)