Was ist Named Entity Recognition (NER)?

Definition Was ist Named Entity Recognition (NER)?

19.07.2022 Von Dipl.-Ing. (FH) Stefan Luber

Named Entity Recognition (NER) ist eine Teildisziplin der Computerlinguistik. Ihre Aufgabe ist es, Eigennamen (benannte Entitäten) in natürlichsprachigen Texten automatisiert zu erkennen und diese vordefinierten Kategorien zuzuordnen. Eigennamen sind beispielsweise Namen von Personen, Firmennamen, Orte, Ereignisse oder Zeitangaben. NER lässt sich wörterbuchbasiert, regelbasiert oder mithilfe von überwachtem maschinellem Lernen durchführen.

Named Entity Recognition, abgekürzt NER, ist ein Begriff aus dem Umfeld des Natural Language Processing (NLP). NLP, im Deutschen als Computerlinguistik bezeichnet, versucht natürliche Sprache mithilfe von Computern, Regeln und Algorithmen zu erfassen und zu verarbeiten. Als Teildisziplin der Computerlinguistik hat Named Entity Recognition die Aufgabe, Eigennamen (benannte Entitäten) in natürlichsprachigen Texten automatisiert zu erkennen und in vordefinierte Kategorien einzuordnen. Ein deutscher Begriff für Named Entity Recognition ist Eigennamenerkennung. Bei einem Eigennamen handelt es sich um ein Wort oder eine Folge von Wörtern, die eine Entität wie eine Person, ein Unternehmen, einen Ort, ein Ereignis, ein Produkt oder eine Datumsangabe benennt.

Durch das Erkennen und Klassifizieren der Entitäten lassen sich wichtige Informationen extrahieren, die für das Gesamtverständnis der Bedeutung eines Texts unverzichtbar sind. Named Entity Recognition ist daher im semantischen Teil der Computerlinguistik angesiedelt. NER lässt sich wörterbuchbasiert, regelbasiert oder mithilfe von Künstlicher Intelligenz (KI) und maschinellem Lernen (ML) durchführen. Die Automatisierung von NER ermöglicht es, große Textmengen in kurzer Zeit zu verarbeiten und Informationen zu extrahieren.

Computerbasiertes NER erzielt mittlerweile hohe Erfolgsquoten, die sich kaum von der Leistung menschlich ausgeführter Eigennamenerkennung unterscheiden. NER kann daher als ein gelöstes Problem der Computerlinguistik betrachtet werden. Die Erfolgsquoten können sich allerdings von Sprache zu Sprache stark unterscheiden.

Ablauf von Named Entity Recognition und Herausforderungen

Der prinzipielle NER-Ablauf lässt sich in diese zwei Arbeitsschritte unterteilen:

Identifikation der Eigennamen (benannten Entitäten)

Einordnung der Eigennamen in vordefinierte Kategorien

Bei einem Eigennamen handelt es sich um ein Wort oder eine Wortfolge, die eine Entität benennt. Beispiele für Eigennamen sind Helmut Kohl, Zugspitze, Dreißigjähriger Krieg, Schwarzwald, Volkswagen, 1. April 2001, Der Schrei oder Ostermontag. Im ersten Schritte des Natural Language Processing werden diese Eigennamen in einem Text identifiziert und als solche mit Anfang und Ende markiert. Im zweiten Schritt erfolgt die Zuordnung der identifizierten und markierten Eigennamen zu den zuvor definierten Kategorien. Beispielkategorien sind Personen, Orte, historische Ereignisse, Firmen, Organisationen, Produkte, Kunstwerke oder Datumsangaben.

Beim Erkennen und Kategorisieren der Eigennamen hat NER zahlreiche Herausforderungen zu bewältigen. Beispielsweise müssen Varianten gleicher Eigennamen identifiziert, Formate normalisiert oder die Entitätsgrenzen eindeutig erkannt werden.

Die verschiedenen NER-Verfahren

Für Named Entity Recognition existieren verschiedene Ansätze und Verfahren. Grundsätzlich kann zwischen wörterbuchbasierten, regelbasierten und Machine-Learning-basierten Verfahren unterschieden werden. Einen recht einfachen Ansatz verfolgen die wörterbuchbasierten Verfahren. Die zu analysierenden Texte werden mit Wörterbüchern verglichen. Stimmen Wörter oder Wortfolgen des Textes mit Eigennamen aus den Wörterbüchern überein, werden sie als Eigennamen markiert und der jeweiligen Kategorie zugeordnet.

Regelbasierte Verfahren arbeiten mit muster- und kontextbasierten Regeln, mit denen sie die benannten Entitäten identifizieren und kategorisieren. Diese Verfahren sind meist auf spezifische Textarten und bestimmte Entitätstypen beschränkt.

Die höchsten NER-Erfolgsquoten erzielen Verfahren, die auf Künstlicher Intelligenz und maschinellem Lernen basieren. Machine-Learning-Modelle werden zunächst mithilfe vorbereiteter Datensätze (annotierter Texte) darauf trainiert, Entitäten anhand statistischer Zusammenhänge zu erkennen. Nach dem überwachten Lernvorgang sind die Modelle in der Lage, zuvor nicht gesehene Texte zu analysieren und die Entitäten zu erkennen und Kategorien zuzuordnen. Die Qualität der NER-Ergebnisse hängt von der Menge und Qualität der annotierten Trainingsdaten, der Länge der Lernphase und den verwendeten Algorithmen und ML-Modellen ab.

Named Entity Recognition mit BiLSTM-CRF-Modellen

Sehr hohe NER-Erfolgsquoten erzielen Machine-Learning-Modelle mit BiLSTM-CRF. BiLSTM-CRF ist die Kurzform von Bidirectional Long Short-term Memory with Conditional Random Field. Es handelt sich bei diesen Modellen um künstliche neuronale Netzwerke, die mit bidirektionalem Long Short-term Memory (LSTM) und einem CRF-Layer (Conditional Random Field Layer) ausgestattet sind. Solche Netzwerke werden neben Named Entity Recognition auch für das Part-of-Speech-Tagging (POS-Tagging) verwendet. Für BiLSTM-CRF-Modelle existieren verschiedene Implementierungen wie für die Open-Source-Programmbibliothek für maschinelles Lernen PyTorch.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Anwendungen und Einsatzmöglichkeiten von Named Entity Recognition

Named Entity Recognition kommt für die automatisierte Analyse und Informationsextraktion großer Textmengen zum Einsatz. Typische Anwendungsmöglichkeiten sind:

die Verschlagwortung von Texten

Sortierung und Filterung von Kundenanfragen

Beantwortung von Online-Suchanfragen

wissenschaftliche Arbeit mit historischen Texten

automatisierte Empfehlungssysteme

Informationsextraktion aus klinischen Texten

Erkennen von Nachrichtentrends

(ID:48460027)