Kommentar von Hans-Josef Jeanrond, Sinequa

Falsch verkabelt

| Autor / Redakteur: Hans-Josef Jeanrond / Nico Litzel

Der Autor: Hans-Josef Jeanrond ist VP Kommunikation bei Sinequa
Der Autor: Hans-Josef Jeanrond ist VP Kommunikation bei Sinequa (Bild: Sinequa)

Werte aus (Big) Data zu extrahieren, dazu bedarf es der richtigen Werkzeuge. Große Unternehmen und Behörden haben in der Vergangenheit viel Geld für die Datenanalyse und für Business Intelligence Tools ausgegeben. Zu ihrem Leidwesen können sie damit aber nur zehn, maximal zwanzig Prozent ihrer Daten überhaupt richtig analysieren – strukturierte Informationen aus ERP-, CRM-, SCM oder ähnlichen Unternehmensanwendungen.

Laut IDC sind 90 Prozent der Unternehmensdaten jedoch unstrukturiert („Unlocking the hidden value of data“, David Schubmehl und Dan Vesset, IDC, Juli 2014). „Unternehmen" bedeutet hier, dass diese Daten auch aus externen Quellen stammen können, aber relevant für die Geschäftsprozesse sind. Dabei handelt es sich im Wesentlichen um Textdaten – in vielen verschiedenen Sprachen – aus Projekt- oder Forschungsberichten, internen und externen Veröffentlichungen, Produktbeschreibungen, Governance-Richtlinien und, besonders relevant: E-Mails. Nimmt man noch halb strukturierte Daten wie Logfiles und maschinengenerierte Daten hinzu, erhält man eine Vorstellung davon, welche enormen Datenmengen heute noch immer unbehandelt bleiben.

Woran liegt es also, dass Unternehmen bei den strukturierten Daten im Vergleich so (wiederum laut IDC) „deutlich überinvestiert“ haben? Man könnte annehmen, es existierten schlicht keine leistungsfähigen Tools für die Analyse unstrukturierter Daten. Fakt ist jedoch, dass es schon seit einiger Zeit Werkzeuge für die syntaktische und semantische Analyse, Natural Language Processing (NLP), gibt, die inzwischen auch leistungsfähig im Umgang mit großen Datenmengen sind.

Die Welt will strukturiert sein

Die Missachtung unstrukturierter Daten hat vielmehr tiefere, kulturelle Gründe. Unsere Wissenschaftler, Ingenieure und Programmierer sind geschult, die Welt zu strukturieren, um sie zu verstehen und zu beherrschen. Unstrukturierte Daten sind in dieser Denkart nur Daten, die noch nicht strukturiert wurden. Arbeit, die noch getan werden muss, peinlich genug, dass es noch nicht erledigt ist, noch lange aber kein Grund, sich ihrer Aufbereitung auf neuen Wegen zu nähern.

Wir können noch tiefer zu den Wurzeln graben und kommen zum Buch Genesis: Die Schöpfung ist ein Akt der Schaffung einer göttlichen Ordnung – Trennung von Erde und Himmel, Land und Wasser, Licht und Dunkelheit. Aus Chaos wird Ordnung geschaffen. Die dem Menschen zugedachte Aufgabe, sich die Erde untertan zu machen, umfasst folglich, diesen Ordnungsprozess im Sinne der Schöpfung weiterzuführen.

Massives Datenwachstum

Schauen wir uns auf der Erde indes um, müssen wir konstatieren: Das Volumen an unstrukturierten Daten verdoppelt sich alle zwei Jahre, während die strukturierten Daten um nur 20 Prozent zunehmen. Der Versuch, erfolgreich Ordnung und Struktur herzustellen, wird da zur Suche nach dem Gral, er bleibt immer unerreichbar.

So scheint es, als seien unsere IT-Fachleute und Manager „falsch verdrahtet“. Besser, sie akzeptierten unstrukturierte Daten und machten das Beste daraus, als sie ständig zu bekämpfen. Unordnung ist nichts Peinliches, das noch aufgeräumt werden muss, sondern schlicht eine Tatsache des Lebens. Die technischen Mittel, Informationsschätze aus diesem unstrukturierten Wust zu heben, gibt es mittlerweile und – eine weitere gute Nachricht – sie sind meist weniger kostspielig als die Tools, für die in der Vergangenheit so viel Geld ausgegeben wurde.

Eingeschlagene Pfade verlassen, sich „entkabeln“, ist alles, was man tun muss, um Lösungen für ein Problem zu finden, das sich bislang als so hartnäckig erwiesen hat. Voraussetzung dafür ist jedoch ein Kulturwandel in den Köpfen – wohl die schwierigste Herausforderung,

Ergänzendes zum Thema
 
Über Sinequa

Schneller Kulturwandel steht bevor

Ich glaube dennoch, dass der Kulturwandel schneller kommen wird, als manchem bewusst oder auch lieb ist, und zwar ganz profan aus wachsendem Wettbewerbsdruck heraus. Es gibt bereits Unternehmen, die bahnbrechende Projekte für die Echtzeit-Big-Data-Analyse unstrukturierter Daten umgesetzt haben; die anderen müssen nun folgen, wollen sie nicht abgehängt werden. Und dabei müssen sie mehr als die Vorreiter kopieren. Inspiration statt Imitation ist notwendig, um langfristige Wettbewerbsfähigkeit zu gewährleisten. Wer nur nach Kochrezepten und „Best Practices“ sucht, gewinnt keine Wettbewerbsvorteile, schon gar nicht in einer sich erst entwickelnden Disziplin.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43160311 / Analytics)