Unstrukturierte Dokumente endlich nutzbar machen Box startet „Extract“: KI wandelt Content in strukturierte Daten um

Von Berk Kutsal 1 min Lesedauer

Anbieter zum Thema

Box bringt mit „Box Extract“ einen neuen KI-Dienst an den Start, der unstrukturierte Unternehmensdokumente automatisiert in strukturierte, auswertbare Metadaten überführt. Der Ansatz kombiniert mehrere große Sprachmodelle mit agentenbasierter Logik und zielt auf automatisierte Workflows, schnellere Entscheidungen und neue Analysepfade für Unternehmensdaten.

Box Extract wandelt unstrukturierte Unternehmensdokumente per KI in strukturierte Metadaten um und automatisiert Workflows, Suche und Analysen in Unternehmen.(Bild:  Box)
Box Extract wandelt unstrukturierte Unternehmensdokumente per KI in strukturierte Metadaten um und automatisiert Workflows, Suche und Analysen in Unternehmen.
(Bild: Box)

Unternehmenswissen liegt zu großen Teilen in Verträgen, Richtlinien, Berichten oder technischen Dokumenten – und damit in Formaten, die für klassische Datenplattformen schwer zugänglich sind. Box adressiert dieses Problem mit „Box Extract“, einem neuen KI-basierten Dienst, der Inhalte nicht nur auslesen, sondern strukturell interpretiert und als Metadaten innerhalb der Box-Plattform ablegen möchte.

Zum Einsatz sollen mehrere generative Modelle kommen, darunter Google Gemini 3, Anthropic Claude Opus 4.5 und OpenAI GPT-5.2. Die Modelle sollen durch agentenbasierte Komponenten ergänzt werden, die Dokumente in semantische Einheiten wie Absätze, Tabellen oder Diagramme zerlegen und daraus strukturierte Datenfelder ableiten. Unternehmen können eigene sogenannte Extract Agents definieren und die gewonnenen Metadaten in Analyseumgebungen wie Databricks oder Snowflake weiterverwenden.

Die extrahierten Informationen werden in Box gespeichert und lassen sich für automatisierte Prozesse nutzen – etwa für Suchfunktionen, Dashboards oder Workflow-Engines wie Box Relay und künftig Box Automate. Dadurch werde aus dem klassischen Dokumentenablagesystem ein datengetriebener Prozessbaustein.

Box Extract steht Kunden im Enterprise-Advanced-Tarif zur Verfügung. Zur Auswahl stehen zwei Agenten: Ein Standard Agent deckt schnelle, kosteneffiziente Extraktionen ab, während ein Enhanced Agent für komplexe, multimodale Dokumente ausgelegt ist, etwa bei stark variierenden Formaten oder großen Dokumentenvolumina.

(ID:50681546)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung