Legenden über Data Warehouses, Datenqualität und Datenintegration

Gartner widerlegt die fünf größten Big-Data-Mythen

| Redakteur: Nico Litzel

Das Interesse an Big Data ist hoch. Allerdings sind viele Unternehmen noch in einer sehr frühen Phase: Nur 13 Prozent der Unternehmen setzen ihre Big-Data-Lösungen bereits ein.
Das Interesse an Big Data ist hoch. Allerdings sind viele Unternehmen noch in einer sehr frühen Phase: Nur 13 Prozent der Unternehmen setzen ihre Big-Data-Lösungen bereits ein. (Bild: Gartner 2014)

Gartner ist sich sicher: Der Hype rund um Big Data macht es vielen IT-Verantwortliche schwer, das Potenzial der Technik vollständig zu erschließen. Das IT-Marktforschungs- und Beratungsunternehmen will daher die fünf größten Mythen rund um Big Data widerlegen und so IT-Entscheider dabei unterstützen, ihre Informationsinfrastruktur-Strategien auf ein neues Level zu heben.

Big Data bietet große Chancen, birgt aber auch größere Herausforderungen. Die schiere Datenmenge allein kann nicht die Probleme lösen, die allen Daten innewohnen“, sagt Alexander Linden, Research Director bei Gartner, und ergänzt. „IT-Führungskräfte müssen den Hype und die Verwirrung hinter sich lassen und ihr Handeln auf Fakten und geschäftsorientierte Ergebnisse ausrichten.“

Mythos 1: Bei Big Data liegen alle anderen vor uns

Das Interesse an Big-Data-Technik und -Dienstleistungen ist auf einem Rekordhoch. 73 Prozent der von Gartner 2014 befragten Unternehmen investieren bereits in Big Data oder haben das vor. Allerdings sind viele Unternehmen noch in einer sehr frühen Phase: Nur 13 Prozent der Unternehmen setzen ihre Big-Data-Lösungen bereits ein.

Wie man einen Wert aus Big Data ziehen kann und wie man loslegt, das sind die beiden größten Herausforderungen für Unternehmen. Viele Unternehmen, erklärt Gartner, blieben in der Pilotphase stecken, da sie Big Data nicht mit Geschäftsprozessen oder konkreten Anwendungsfällen verknüpften.

Mythos 2: Wir haben so viele Daten, kleine Fehler fallen nicht ins Gewicht

IT-Führungskräfte glauben, dass bei den großen Datenmengen, die Unternehmen mittlerweile verwalten müssen, kleine Mängel bei der Datenqualität aufgrund des Gesetzes der großen Zahlen nicht ins Gewicht fallen. Einzelne kleine Fehler, so die Ansicht, hätten bei der Datenanalyse keinen Einfluss auf das Gesamtergebnis.

„In der Realität – auch wenn jeder einzelne Fehler eine viel geringere Auswirkung in Relation zur Gesamtdatenmenge hat als früher, weil die Gesamtdatenmenge größer ist – kommt es aufgrund der größeren Datenmengen unterm Strich zu mehr Fehlern“, erklärt Ted Friedman, Vice President und Analyst bei Gartner. „Daher bleibt die Gesamtauswirkung bei einer schlechten Datenqualität in Bezug auf den Gesamtdatensatz gleich. Darüber hinaus kommen viele der Daten, die Unternehmen im Zusammenhang mit Big Data nutzen, von extern oder weisen eine unbekannte Struktur und Herkunft auf. Das bedeutet, dass Probleme bei der Datenqualität sogar noch wahrscheinlicher werden. In der Big-Data-Welt ist die Datenqualität eigentlich noch wichtiger.“

Mythos Nr. 3: Big-Data-Technik macht eine Datenintegration überflüssig

Allgemein wird angenommen, dass Big-Data-Technik – und speziell die Möglichkeit, Informationen über einen „Schema-on-Write“-Ansatz zu verarbeiten – es Unternehmen ermöglichen wird, die gleichen Quellen mit mehreren Datenmodellen auszulesen. Viele glauben, dass diese Flexibilität es Anwendern ermöglicht, zu bestimmen, wie man sämtliche Daten-Assets auf Abruf interpretieren kann. Auch, so die vorherrschende Meinung, werde der Datenzugriff auf einzelne Benutzer zugeschnitten.

In der Realität verlassen sich die meisten Nutzer von Informationen deutlich auf „Schema-on-Write“- Szenarien. Hier werden die Daten beschrieben und die Inhalte vorgeschrieben und es wurde eine Vereinbarung über die Integrität der Daten festgelegt und wie sich die Daten auf die Szenarien auswirken.

Mythos 4: Es ist sinnlos, ein Data Warehouse für Advanced Analytics einzusetzen

Ein Data Warehouse aufzusetzen, das halten viele Projektverantwortliche für zeitaufwendig und sinnlos, wenn für erweiterte Analysen neue Datentypen herangezogen werden sollen, die über ein Data Warehouse hinausgehen.

Wahr ist, dass viele Advanced-Analytics-Projekte bei der Analyse auf ein Data Warehouse zurückgreifen. In allen anderen Fällen müssen Verantwortliche neue Datentypen weiterentwickeln, die Teil von Big Data sind, um sie in eine für die Analyse geeignete Form zu bringen. Verantwortliche müssen also entscheiden, welche Daten relevant sind, wie sie zu aggregieren sind und welches Niveau an Datenqualität notwendig ist. Diese Weiterentwicklung von Daten kann schließlich auch an anderen Orten als dem Data Warehouse vonstatten gehen.

Mythos 5: Data Lakes werden das Data Warehouse ablösen

Die Anbieter von Data Lakes vermarkten ihre Lösungen als unternehmensweite Datenmanagement-Plattformen zur Analyse von unterschiedlichen Datenquellen in ihrem nativen Format. In der Realität ist es aber irreführend, wenn Anbieter Data Lakes als Ersatz für Data Warehouses oder als kritisches Element in der analytischen Infrastruktur der Kunden positionieren.

Der Basistechnologie von Data Lakes, so Gartner, fehlt es im Vergleich zu etablierten Data Warehouses an Reife und Breite. „Data Warehouses können bereits eine Vielzahl von Anwendern in einer Organisation unterstützen. Projektverantwortliche müssen nicht warten, bis Data Lakes hier aufholen“, erklärt Nick Heudecker, Research Director bei Gartner.

Weitere Informationen stellt Gartner in den auf Englisch verfassten Berichten „Major Myths About Big Data's Impact on Information Infrastructure“ und „Major Myths About Big Data's Impact on Analytics“ bereit (Registrierung erforderlich).

Die Auswirkungen von Big Data beleuchtet Gartner zudem auf dem „Gartner Business Intelligence & Analytics Summit 2014“, der am 21. und 22. Oktober in München stattfinden wird.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 42989572 / Infrastruktur)