Definition Was ist Amazon Comprehend?

Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Amazon Comprehend ist ein im Rahmen der Amazon Web Services erbrachter voll verwalteter NLP-Service (Natural Language Processing Service). Mithilfe des Services lassen sich Einblicke in Texte gewinnen und Bedeutungen oder Beziehungen erkennen. Er basiert auf einem trainierten Modell des maschinellen Lernens und ermöglicht beispielsweise Schlüsselbegriff-Extraktionen, Stimmungsanalysen oder die Erkennung von Entitäten.

Firmen zum Thema

(Bild: © aga7ta - stock.adobe.com)

Amazon Comprehend ist der Name eines voll verwalteten Dienstes, der im Rahmen der Amazon Web Services (AWS) erbracht wird. Er lässt sich einsetzen, um Texteinblicke zu gewinnen und Beziehungen oder Bedeutungen in Texten zu erkennen. Es handelt sich um einen Service der natürlichen Sprachverarbeitung (im Englischen: Natural Language Processing, abgekürzt NLP), der auf einem trainierten Modell des maschinellen Lernens basiert und Informationen in unstrukturierten Daten (Texten) erkennt und extrahiert. Unter anderem unterstützt Amazon Comprehend die Extraktion von Schlüsselbegriffen, die Analyse von Stimmungen, das Erkennen von Sprachen, das Erkennen von Entitäten (beispielsweise Personen oder Orte) und Themenmodellierungen.

Der Service stellt APIs (Application Programming Interfaces) bereit, über die die verschiedenen Funktionen aus eigenen Anwendungen heraus und unter Angabe des Speicherorts der zu analysierenden Texte angesprochen werden können. Die APIs liefern Informationen im JSON-Format aus. Einsetzbar ist Amazon Comprehend für Anwendungen, bei denen es beispielsweise um das Verstehen und Analysieren des Inhalts von Texten geht.

Das Machine-Learning-Modell von Amazon Comprehend wird ständig weiter trainiert und liefert kontinuierlich verbesserte Ergebnisse. Aufgaben wie die Verwaltung und Bereitstellung der Trainingsdaten, das Trainieren des Modells, das Skalieren der Ressourcen oder die Bereitstellung der benötigten Rechen- und Speicherressourcen übernimmt Amazon. Amazon Comprehend ist in der Lage, großen Mengen an Texten und Dokumenten in kurzer Zeit zu analysieren. Das Pricing für den Service ist nutzungsabhängig. Unterstützte Sprachen sind Deutsch, Französisch, Englisch, Portugiesisch, Italienisch, Spanisch, Chinesisch, Koreanisch, Hindi, Arabisch und Japanisch.

Grundfunktionen und APIs von Amazon Comprehend

Nutzer von Amazon Comprehend benötigen kein eigenes Know-how aus Bereichen wie dem Natural Language Processing oder dem Machine Learning. Der Service wird von Amazon vollständig verwaltet und direkt nutzbar bereitgestellt. Er ist aus eigenen Anwendungen über APIs ansprechbar. Amazon trainiert das Modell kontinuierlich weiter und stellt die benötigten Trainingsdaten selbst zur Verfügung. Um Funktionen des Services auszuführen, stellt der Anwender die Analyseanforderungen und die Informationen über den Speicherort des zu analysierenden Textes zur Verfügung. Die Ergebnisse liefert der Service in strukturierten Formaten wie dem JSON-Format. Folgende Funktionen sind über APIs ansprechbar:

  • Enitätenerkennung: Erkennen von Entitäten wie Personen, Orten oder Produktbezeichnungen und Marken sowie die Möglichkeit der Erkennung von benutzerdefinierten Entitäten
  • Sprachenerkennung: Erkennen der dominierenden Sprache eines Textes (über 100 Sprachen werden erkannt)
  • Stimmungsanalyse: Analyse der Grundstimmung und der Emotion eines Textes (positiv, negativ, neutral oder gemischt)
  • Schlüsselphrasenextraktion: Erkennen und Extrahieren von Schlüsselphrasen und Schlüsselsätzen
  • Themenmodellierung: Zuordnen und Gruppieren von Texten zu Themen und Begriffen
  • Syntaxanalyse: Erkennen der Syntax und verschiedener Wortarten (Substantive, Adjektive, Verben etc.)
  • benutzerdefinierte Klassifizierung von Textinhalten

Amazon Comprehend Medical

Amazon Comprehend Medical ist eine Variation des Services Amazon Comprehend. Sie basiert auf den gleichen Funktionsprinzipien, ist aber auf das Erkennen und Analysieren komplexer medizinischer Informationen spezialisiert. Mit dem Service lassen sich Gesundheitsdaten aus medizinischen Texten wie Attesten, Berichten zu klinischen Studien oder aus Patientenakten extrahieren. Extrahierte Informationen sind beispielsweise die Dosierungen von Medikamenten oder Gesundheitszustände von Patienten.

Anwendungsmöglichkeiten von Amazon Comprehend

Der NLP-Cloud-Service Amazon Comprehend bietet zahlreiche Anwendungsmöglichkeiten. Durch das Erkennen von Beziehungen in Texten und das Erfassen von Bedeutungen lässt sich der Service beispielsweise zur Analyse von schriftlichen oder transkribierten Anfragen im Kundenservice, von Beiträgen in sozialen Netzwerken oder von Nachrichten verwenden. Beispielsweise erkennt und analysiert Amazon Comprehend die Kundenstimmung bei der Nennung bestimmter Produkte oder Produktfunktionen. Kundennachrichten lassen sich nach Schlüsselwörtern oder Entitäten durchsuchen oder Dokument nach Themen organisieren. Die aus den Texten gewonnenen Informationen sind nutzbar, um personalisierte oder nach Themen kategorisierte Informationen bereitzustellen, Empfehlungen zu liefern, Kundenanfragen den Bearbeitern zuzuordnen und Kundenprobleme zu lösen oder medizinische Aufgabenstellungen beispielsweise im Rahmen klinischer Studien zu bearbeiten.

Die Vorteile von Amazon Comprehend

Der voll verwaltete NLP-Service Amazon Comprehend bietet Vorteile wie:

  • Anwender benötigen kein eigenes NLP- oder Machine-Learning-Know-how
  • das Machine-Learning-Modell wird von Amazon kontinuierlich weiter trainiert und optimiert. Es müssen keine eigenen Trainingsdaten bereitgestellt werden
  • die komplette Infrastruktur für Amazon Comprehend wird im Rahmen der Amazon Web Services bereitgestellt
  • Amazon Comprehend liefert Einblicke in Texte und erkennt Bedeutungen
  • die verschiedenen Funktionen des Services lassen sich über APIs direkt aus eigenen Anwendungen heraus ansprechen
  • es sind keine Eigenentwicklungen für Textanalysen notwendig
  • der Service ist hoch skalierbar und analysiert große Textmengen in kurzer Zeit
  • Deep-Learning-Technologien liefern hochwertige und exakte Ergebnisse
  • spezieller Service und eigene API für medizinische Aufgabenstellungen verfügbar
  • sichere Verschlüsselung der Volumendaten und der Ergebnisse
  • voll in die AWS-Welt integriert und kompatibel mit anderen Diensten wie AWS Lambda oder S3
  • nutzungsabhängiges Pricing, keine einmaligen Investitionen notwendig

(ID:47380829)

Über den Autor