APARAVI 2.9 geht an den Start Textinhalte in Bildern, Scans und Videos zuverlässiger erkennen

Von Martin Hensel 1 min Lesedauer

Anbieter zum Thema

APARAVI hat Version 2.9 seiner Data-Intelligence- und Automation-Plattform vorgestellt. Im Mittelpunkt der Aktualisierung stehen neue KI-gestützte Optionen zur Texterkennung in Bildern, Scans und Videos.

APARAVI hat mit Version 2.9 seiner Plattform verbesserte KI-gestützte OCR-Funktionen eingeführt.(Bild:  APARAVI)
APARAVI hat mit Version 2.9 seiner Plattform verbesserte KI-gestützte OCR-Funktionen eingeführt.
(Bild: APARAVI)

In APARAVI 2.9 sind nun erweiterte OCR-Features („Optical Character Recognition“) integriert. Sie finden und extrahieren durch systematische und automatisierte Schrifterkennung Texte in Hunderten von Dateitypen mit hoher Zuverlässigkeit und Qualität. Derzeit werden über 50 Sprachen sowie lateinische und kyrillische Schrift unterstützt. Die Bandbreite reicht dabei von Afrikaans bis Vietnamesisch.

Als Grundlage des Systems dient eine Deep-Learning-Engine, die spezifische KI- und Machine-Learning-Fähigkeiten mitbringt. Ihr Herzstück ist ein auf CRAFT („Character Region Awareness For Text Detection“) aufbauendes Detektor-Modell, das mithilfe von CNN („Convolutional Neural Networks“) Textabschnitte in Bildern oder Videos lokalisiert. Diese werden anschließend analysiert und an den Language Recognizer zur Texterkennung und -bereitstellung weitergeleitet.

Einsatzmöglichkeiten ausgebaut

Die neuen OCR-Fähigkeiten erschließen der APARAVI-Plattform zusätzliche Anwendungsszenarien und Einsatzmöglichkeiten. Als Beispiel nennt der Anbieter etwa datenforensische Untersuchungen („e-Discovery“), in deren Rahmen sich nicht nur textbasierte Dateiformate, sondern auch unstrukturierte Daten wie etwa Chatverläufe mit Texten, Bildern, Sprachnachrichten und Videos nach Informationen scannen lassen. Da laut APARAVI rund 80 Prozent unstrukturierte Daten in typischen Datenbeständen liegen, wird durch das Update für mehr Transparenz, Zugänglichkeit und Analysierbarkeit gesorgt. Dark Data soll der Vergangenheit angehören. Zudem wird eine akkurate und effiziente Aufbereitung von Trainingsdaten für die KI-Entwicklung möglich.

„OCR macht es möglich, große Mengen an Text aus unstrukturierten Dateien zu extrahieren, ganz egal in welchem Ursprungsformat sie vorliegen. Diese Textinformationen sind eine wichtige Voraussetzung, um KI-Anwendungen praxisnah in die Arbeitsprozesse zu integrieren“, erklärt APARAVI-CEO Adrian Knapp.

(ID:49793126)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung