Was ist Word Sense Disambiguation?

Definition Was ist Word Sense Disambiguation?

16.02.2022Von Dipl.-Ing. (FH) Stefan Luber

Word Sense Disambiguation ist die Bestimmung der beabsichtigten Bedeutung mehrdeutiger Wörter oder Ausdrücke mithilfe des Kontexts, indem sie verwendet werden. Für die Computerlinguistik ist Word Sense Disambiguation eine wichtige Aufgabe. Nur durch die Bestimmung des genauen Wortsinns lassen sich Anwendungen wie maschinelle Übersetzungen oder sprachverstehende Systeme realisieren. Es existieren zahlreiche verschiedene Methoden zur Wortsinn-Disambiguierung.

Anbieter zum Thema

QUNIS GmbH

Das Akronym für Word Sense Disambiguation lautet WSD. Der deutsche Begriff ist Wortsinn-Disambiguierung. Es handelt sich bei WSD um die Bestimmung der im jeweiligen Kontext beabsichtigen Bedeutung mehrdeutiger Wörter oder Ausdrücke. In fast allen Sprachen können Wörter oder Ausdrücke abhängig vom Kontext, in dem sie verwendet werden, unterschiedliche Bedeutungen haben. Beispiele für solche Wörter im Deutschen sind Bank (Geldinstitut oder Sitzgelegenheit), Kiefer (Körperteil oder Baum) oder Strauß (Vogel oder Blumenstrauß).

Das englische Wort für Mehrdeutigkeit lautet „ambiguity“. Für die Computerlinguistik (Natural Language Processing – NLP) ist Word Sense Disambiguation eine wichtige Aufgabe. Nur wenn es gelingt, die beabsichtigte Bedeutung eines Worts im jeweiligen Kontext eindeutig zu bestimmten, lassen sich NLP-Anwendungen wie maschinelle Übersetzungen, Information Extraction (IE) oder sprachverstehende Systeme realisieren.

Im Wesentlichen ist Word Sense Disambiguation eine Klassifizierungsaufgabe. Die verschiedenen Wortbedeutungen stellen die Klassen dar. Über den Kontext lässt sich einem Wort oder einem Ausdruck die im vorliegenden Text beabsichtigte Klasse zuweisen. Zur Bestimmung der Bedeutung der Wörter oder Ausdrücke können verschiedene Methoden und Verfahren zum Einsatz kommen. Beispiele für WSD-Methoden sind lexikalische oder wissensbasierte Methoden, überwachte Methoden oder unüberwachte Methoden. Häufig werden Verfahren und Algorithmen der Künstlichen Intelligenz (KI), des Maschinellen Lernens (ML) und Künstliche Neuronale Netzwerke (KNN) verwendet.

Vorgehensweise bei der Wortsinn-Disambiguierung

Ohne auf die Verfahren oder Methoden der Wortsinn-Disambiguierung im Detail einzugehen, lässt sich die grundsätzliche Vorgehensweise zur Bestimmung der beabsichtigten Bedeutung eines Worts oder eines Ausdrucks in drei Schritte unterteilen.

Im ersten Schritt müssen alle möglichen mehrdeutigen Ausdrücke und Wörter eines vorliegenden Texts ermittelt werden. Für diese mehrdeutigen Ausdrücke und Wörter gilt es im nächsten Schritt, alle grundsätzlich möglichen Bedeutungen herauszufinden. Dies kann beispielsweise über Lexika erfolgen, die die in der jeweiligen Sprache existierenden Bedeutungen der Wörter und Ausdrücke auflisten und definieren. Im letzten Schritt erfolgt die Zuweisung der tatsächlich beabsichtigten Bedeutung durch die Beachtung des Kontexts, indem die Wörter oder Ausdrücke verwendet werden. Der Kontext bestimmt die Wahrscheinlichkeit für eine Bedeutung. Die Bedeutung kann beispielsweise von der Stellung eines Worts innerhalb des Satzes, von der Verwendung bestimmter Artikel, Adjektive oder Wörter in unmittelbarer Nähe oder von anderen Sätzen und Abschnitten eines Textes abhängen.

Methoden und Verfahren in der Computerlinguistik

In der Computerlinguistik existiert eine Vielzahl verschiedener Methoden und Verfahren zur Wortsinn-Disambiguierung. Grundsätzlich lässt sich zwischen einfachen (flachen) und fortgeschrittenen (tiefen) Ansätzen unterscheiden. Flache Ansätze versuchen nicht den vorliegenden Text zu verstehen, sondern verwenden relativ einfache Regeln zur Disambiguierung. Das können Wenn-dann-Regeln für die angrenzenden Wörter des zu bestimmenden Ausdrucks sein. Beim mehrdeutigen deutschen Wort „Bank“ lassen beispielsweise die beiden vorangestellten Wörter „in die“ direkt auf die Verwendung des Worts in der Bedeutung von Geldinstitut und nicht von Sitzgelegenheit schließen.

Tiefe Ansätze stützen sich auf Wissen und versuchen die Wortbedeutung auf Basis von Textverständnis zu bestimmen. Sie sind wesentlich aufwendiger, nutzen komplexe Algorithmen und Verfahren und erfordern ein höheres Maß an Rechnerleistung.

Gebräuchliche WSD-Methoden sind:

lexikalische oder wissensbasierte Methoden

überwachte Methoden

unüberwachte Methoden

Lexikalische oder wissensbasierte Methoden stützen sich beispielsweise auf in Form von maschinenlesbaren Wörterbüchern vorliegendes Wissen. Für die Definitionen der verschiedenen Wortbedeutungen werden in den Wörterbüchern jeweils bestimmte Wörter oder Ausdrücke verwendet. Vergleicht man diese mit denen im vorliegenden Text, lässt sich mit einer hohen Wahrscheinlichkeit auf die beabsichtigte Bedeutung schließen. Eine sehr bekannte lexikalische Methode ist die Lesk-Methode, auch Lesk-Algorithmus genannt.

Überwachte Methoden basieren auf maschinellem Lernen und dem Training mit einem bereits vollständig disambiguierten Trainingsdatensatz. In dem Trainingsdatensatz sind die korrekten Bedeutungen der Wörter gekennzeichnet. Durch das Training lernt das System, die Wörter richtig zu klassifizieren und kann dieses Wissen anschließend auf beliebige andere Datensätze (Texte) anwenden. Nachteil dieser Methode ist der hohe Aufwand zum Erstellen geeigneter Trainingsdaten.

Unüberwachte Methoden bestimmten den Wortsinn ohne einen speziell annotierten Trainingsdatensatz. Sie verwenden für das Training Rohtexte und Informationen über die verschiedenen Bedeutungen von Wörtern oder Ausdrücken und entwickeln daraus einen Algorithmus für beliebige Eingabetexte.

Neben lexikalischen, überwachten und unüberwachte Methoden kommen für WSD auch Kombinationen dieser Methoden wie halbüberwachte (semi-supervised) oder minimalüberwachte (minimally supervised) Methoden zum Einsatz.

(ID:47999097)