Kommentar von Mark Zimmermann, Infomotion

Warum Big Data und BI künftig verschmelzen

| Autor / Redakteur: Mark Zimmermann / Nico Litzel

Der Autor: Mark Zimmermann ist Geschäftsführer der Infomotion GmbH
Der Autor: Mark Zimmermann ist Geschäftsführer der Infomotion GmbH (Bild: Infomotion)

Alle Unternehmen sammeln mittlerweile Daten – aber die wenigsten verarbeiten sie effizient. Ein Grund dafür ist häufig die organisationsinterne Trennung von Business Intelligence und Big Data. Meist verarbeiten Unternehmen sie in jeweils unterschiedlichen Abteilungen: Der CIO ist für BI verantwortlich, der CDO für die innovativen Big-Data-Projekte. Doch genau hier gehen Effizienz und Synergien verloren. Künftig werden beide Bereiche immer stärker zur Data Science verschmelzen.

Zu Beginn des analytischen Datenmanagements standen relationale Datenbank-Managementsysteme (RDBMS). Diese Art der Datenverwaltung war besonders geeignet für transaktionsorientierte Anwendungen. Für die analytische Verarbeitung von Daten waren RDBMS aufgrund ihrer geringen Leistungsfähigkeit nicht geeignet.

Data Warehouses ermöglichen Datenanalyse

Bill Inmon, US-Informatiker und Erfinder der „Information Factory“, erkannte diese Grenzen und entwickelte deshalb das Prinzip „Data Warehouse“ (DWH). Dabei handelt es sich um zentralisierte Datenbanken, die speziell für die Analyse von Daten optimiert sind. Sie führen Informationen aus mehreren, meist heterogenen Quellen zusammen, um sie anschließen zu verdichten. Die Erfindung der DWHs war ein Meilenstein, denn damit entfernte sich das Datenmanagement von den rigiden Normalisierungs-Regeln, die die transaktionsorientierte Datenmodellierung vorgibt.

Um die Performance und Simplizität des Datenmodells zu steigern, werden dabei Redundanzen in Kauf genommen und Speicherplatz bewusst „verpulvert“. Für zusätzlich erhöhte Aussagekraft entsprechender Systeme wird jede Änderung als neuer Datensatz hinzugefügt, statt vorhandene Daten zu aktualisieren. Das war der Start der Historisierung bei Datenbanken, dem Festhalten der zeitlichen Entwicklung von Datenänderungen.

Neue Ordnungssysteme für steigende Datenmengen

Ich sehe diesen Meilenstein als die Geburt der Business Intelligence (BI). Im Zuge dessen entwickelten sich Systeme für Online Analytical Processing (OLAP). Sie nutzen mehrdimensionale Daten-Speicherung und -Darstellung, um schnelle Analysen umsetzen zu können. Zu Beginn des Jahrtausends rückte die Optimierung dieser Systeme in den Vordergrund, mit Schwerpunkt Datenspeicherung, Anwendung und Individualisierung für Nutzer. Gleichzeitig stiegen die zu verarbeitenden Datenmengen deutlich an.

Grund dafür war, dass es immer wichtiger wurde, binäre Objekte wie etwa Bilder zu speichern, zu visualisieren und darzustellen. Dabei waren neue Ordnungssysteme gefragt, denn die Informationen ließen nicht einfach nach bekannten Schemen ablegen. Insgesamt wuchsen die Anforderungen aus den klassischen Unternehmensdaten heraus hin zu heterogenen, vielschichtigen und vielfältigen Daten, teilweise ohne erkennbare Struktur oder schematische Einordnung.

Die neun Vs der Datenanalyse

Aufgrund der Innovationen rund um das Hadoop-Filesystem manifestierte sich der Begriff „Big Data“ als Synonym für alle diese technologischen und fachlichen Entwicklungen – auf der Entwicklungs- wie auf der Anwendungsebene. Um die Eigenschaften dieser Datenmengen zu beschreiben, haben sich die „Vs“ etabliert: Volume, Velocity, Veracity, Variety, Validity, Viability, Visibility, Volatility. Das wichtigste dieser Vs ist jedoch Value, das den ökonomischen Wert der Daten beschreibt. Aus der Erkenntnis, dass in all diesen Daten, in ihrer Kombination, in der unkonventionellen, teilweise nicht strukturierten Auswertung, in den aus all diesem gewonnen Erkenntnissen, das in alledem ein unfassbar großer Wert steckt.

Bis dahin hatte analytisches Datenmanagement ein Schattendasein gefristet: Weder in den Controlling- und Reportingabteilungen, noch bei den Analysten spielten entsprechende Auswertungen eine große Rolle. Spätestens, als die Vorstände der „Fortune-500“-Unternehmen erkannten, welcher ökonomische Wert in den verarbeiteten Daten steckt, wurde Big Data zum Bestandteil vieler Unternehmensstrategien. Begründet oder unbegründet, fundiert oder nicht.

Big Data steht stellvertretend für Digitalisierung

Das Thema Big Data wurde zum Synonym für den Themenkomplex Digitalisierung – über die technologische und fachliche Betrachtung hinaus. Zudem entwickelte sich der Begriff zum Imageträger für agiles Handeln. Gleichzeitig gilt Business Intelligence nach wie vor als reine Verarbeitung von Unternehmerdaten. Bimodale Organisationsmodelle für die IT, die Verbindung von klassischer und agiler Entwicklung, wurden und werden deshalb genau so diskutiert wie weitere agile Projektmanagement-Methodiken. Die so entstandene Ambivalenz zwischen Business Intelligence und Big Data besteht bis heute fort. Sie zeigt sich in Systemen, Organisationsformen und Technologien: Big Data gilt als modern, BI als althergebracht. Big Data wird als agil angesehen, BI als starr. Big Data steht für Digitalisierung, BI für IT-Commodity, Big Data wird vom CDO betreut, für BI ist der CIO zuständig. Diese Liste lässt sich beliebig weiterführen.

Big Data und Business Intelligence integrieren

In unserem eigenen Unternehmen haben wir diese Ambivalenz übrigens schon lange über Bord geworfen und integrieren beide Systeme. Data Lake, Ingestion und Serving Area haben viel mehr mit DWH, Staging und Data Marts zu tun, als es landläufig angenommen wird. Wir nutzen unsere langjährige Erfahrung aus dem Bereich BI, um den Einsatz von Big-Data-Systemen zu einem Erfolg zu machen. Die Folge: BI-Systeme und Big-Data-Plattformen wachsen nach und nach zusammen. Virtuell und materiell.

Die Grenzen zwischen Open und Closed Data verschwimmen. Technologisch werden Brücken gebaut, Big-Data-Systeme dienen als günstiger Near Line Storage für teure Businessanwendungen wie die SAP HANA. Damit lassen sich Daten in größeren Mengen für die schnelle Verarbeitung zwischenspeichern. Zudem entwickeln wir nach und nach DWH-Ansätze, die auf Big-Data-Technologien basieren. Dabei müssen in absehbarer zahlreiche Systeme migriert werden. Das bedeutet, dass leistungsfähige RDBMS ins Hintertreffen geraten.

Gleichzeitig verliert die klassische BI in simplen Bereichen an Bedeutung, denn die operativen Systeme sind heute aufgrund ihrer hohen Leistungsfähigkeit in der Lage, vielen Aggregationen und großen Datenmengen zu verarbeiten. Unternehmen, die entsprechende Technologien heute schon einsetzen, können Produkte und Dienstleistungen individueller auf ihre Kunden zuschneiden, ihr Produktsortiment passend erweitern und aus den gesammelten Daten sogar neue Geschäftsmodelle entwickeln.

Data Science verbindet Big Data und Business Intelligence

Für unsere Arbeit bei Kunden heißt das heute auch oft, organisatorische Brücken aufzubauen. Technologien und Bereiche wieder zusammen zu führen. Vorbehalte bezüglich starrer Organisationsstrukturen und agilem Vorgehen gegenseitig auszuräumen um so Kooperation und Integration innerhalb der Unternehmen zu fördern – zwischen Big Data und Business Intelligence sowie zwischen CIO und CDO. Spätestens in fünf Jahren wird nicht mehr zwischen Big Data und BI unterschieden werden. Für alle Möglichkeiten, die analytisches Datenmanagement bietet, wird dann als Überbegriff womöglich Data Science dienen. Hier spielt dann die Tatsache mit, dass ein weiterer Themenkomplex – AI beziehungsweise Künstliche Intelligenz – Einzug gehalten hat und mit mehrstufigen neuronalen Netzen den Value aus unseren Datenmassen herausfiltriert.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45292692 / Infrastruktur)