Definition Was ist Amazon Textract?

Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Amazon Textract ist ein im Rahmen der Amazon Web Services erbrachter Cloud-Dienst, der gedruckten oder handgeschriebenen Text aus eingescannten Dokumenten, Bildern oder PDF-Dateien extrahiert. Der Funktionsumfang geht über klassisches OCR hinaus, da Amazon Textract nicht nur die Zeichenerkennung beherrscht, sondern auch strukturierte Informationen aus Tabellen oder Formularen erfasst.

Firmen zum Thema

(Bild: © aga7ta - stock.adobe.com)

Amazon Textract ist die Produktbezeichnung eines im Rahmen der Amazon Web Services (AWS) erbrachten, voll verwalteten Cloud-Dienstes. Der Service extrahiert handgeschriebenen oder gedruckten Text aus unterschiedlichen Arten von Dokumenten und Dateien wie gescannten Dokumenten, Tabellen und Formularen, PDF-Dateien, Bildern oder Fotos. Es kommen Verfahren der Künstlichen Intelligenz (KI) und des Machine Learnings (ML) zum Einsatz, die weit über den Funktionsumfang von klassischem Optical Character Recognition (OCR) hinausgehen.

Es werden nicht nur Zeichen, sondern auch Formatierungen und die Struktur der Texte erkannt. Beispielsweise bleibt der volle Informationsgehalt von Formularen oder Tabellen erhalten. Dank intelligenten ML-Verfahren kommt Amazon Textract mit unterschiedlichen Dokumententypen, Formatierungen und Strukturierungen ohne manuelle Konfigurationsarbeiten zurecht. Bei Bedarf lässt sich der Workflow einer menschlichen Überprüfung in die Textextraktion integrieren.

Amazon Textract unterstützt zahlreiche Sprachen wie Deutsch, Englisch, Spanisch, Französisch, Italienisch oder Portugiesisch und führt die Extraktion mit hoher Geschwindigkeit aus. Nutzbar ist der Service per Konsole, Command Line Interface (CLI) oder Application Programming Interface (API). Das Pricing des Services ist nutzungsbasiert. Es sind weder Vorableistungen noch Mindestgebühren zu entrichten. Die Kosten sind abhängig von der Seitenanzahl der zu extrahierenden Dokumente. Für den Einstieg und das Testen des Services steht zu Beginn der Nutzung ein kostenloses Kontingent zur Verfügung. Amazon Textract ist voll in die AWS-Welt integriert und arbeitet mit weiteren intelligenten Services wie Amazon Translate oder Amazon Comprehend zusammen.

Funktionsweise und Funktionsumfang von Amazon Textract

Nutzbar ist Amazon Textract per Konsole, Command Line Interface oder API. Im Fall der API-Nutzung stellt der Service mit der Detect Document Text API und der Analyze Document API zwei APIs bereit. Mit der Detect Document Text API lässt sich per OCR der handgeschriebene oder gedruckte Text aus dem Dokument extrahieren. Aufgabe der Analyze Document API ist es, neben der Erkennung des handgeschriebenen oder gedruckten Textes Informationen wie Daten in unterschiedlichen Tabellen- oder Formularfeldern sowie ihre Beziehungen zu extrahieren und Schlüsselwertpaare zu bilden. Dies bietet die Möglichkeit, strukturierte Daten einzulesen.

Beispielsweise wird bei der Extraktion eines Adressformulars aus dem Feld „Postleitzahl“ und dem Inhalt des Felds, die eigentliche Postleitzahl, ein Schlüsselwertpaar gebildet. Datenbanken lassen sich mit diesen Informationen leichter mit den erfassten Daten befüllen. Zu den extrahierten Daten liefert Amazon Textract die entsprechenden Koordinaten einer Zeichen-Box beziehungsweise eines Polygon-Rahmens aus. Zusätzlich erstellt Amazon Textract für die extrahierten Informationen einen Confidence-Score. Er informiert darüber, wie exakt und verlässlich die extrahierten Daten sind. Auf Basis dieses Confidence-Scores lässt sich eine Business-Logik erstellen, ab welchem Score Daten beispielsweise direkt verwendet werden dürfen oder einer weiteren Prüfung zu unterziehen sind. Im Fall einer notwendigen Prüfung durch Menschen integriert Amazon Textract einen Workflow in Amazon Augmented AI (Amazon A2I).

Um handgeschriebene oder gedruckte Texte zu extrahieren und Strukturen oder Beziehungen in den Dokumenten zu erfassen, wendet Amazon Textract Verfahren der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML) an. Das versetzt Amazon Textract in die Lage, Dokumente zu lesen, ohne dass zuvor manuelle Angaben über die Struktur oder den Inhalt der Dokumente gemacht werden müssen. Dank Machine Learning und dem Training mit Millionen unterschiedlicher Dokumente werden die Ergebnisse des Services kontinuierlich exakter und besser.

In Sachen Datensicherheit ist Textract nach Aussage von Amazon mit zahlreichen gesetzlichen Vorgaben und Compliance-Richtlinien konform. Der Service unterstützt Amazon Virtual Private Cloud (VPC) über AWS PrivateLink und ermöglicht die Verwendung vom Internet abgeschotteter, sicherer und verschlüsselter Datenverbindungen.

Vorteile von Amazon Textract

Typische Vorteile von Amazon Textract sind:

  • von Amazon voll verwalteter Cloud-Service – keine eigene IT-Infrastruktur oder Investitionen in Hard- und Software notwendig
  • vielfältig über Konsole, CLI oder API nutzbar
  • erkennt handgeschriebenen oder gedruckten Text mit hoher Genauigkeit und Zuverlässigkeit
  • kann strukturierte Daten beispielsweise in Tabellen oder Formularen erfassen und passende Schlüsselwertpaare liefern
  • ein Confidence-Score der extrahierten Informationen erlaubt die Abbildung einer Business-Logik
  • Workflow der manuellen Prüfung durch Menschen integrierbar
  • mit verschiedenen Dateiformaten wie PDF, PNG oder JPG kompatibel
  • Extraktion der Daten mit hoher Performance in kurzer Zeit
  • kontinuierliche Verbesserung des Services dank Künstlicher Intelligenz und Maschinellem Lernen
  • nutzungsabhängiges Pricing – keine Mindestgebühren oder Vorableistungen zu zahlen
  • voll in die AWS-Welt integriert und mit anderen Amazon-Services kombinierbar

(ID:47494592)

Über den Autor