Kommentar von Martin Walters, Oracle

Big-Data-Projekte effizient umsetzen

| Autor / Redakteur: Martin Walters / Nico Litzel

Der Autor: Martin Walters ist Director Big Data Analytics EMEA bei Oracle
Der Autor: Martin Walters ist Director Big Data Analytics EMEA bei Oracle (Bild: Oracle)

Unternehmen verfügen schon heute über Unmengen digitaler Daten und das Volumen nimmt weiter in atemberaubender Geschwindigkeit zu. Doch die Erkenntnis, dass dieses Kapital für Unternehmen ähnlich wertvoll sein kann, wie ihr finanzielles Kapital, setzt sich in den Führungsetagen nur langsam durch.

Einige der großen Player, wie Amazon und Google, haben das längst verstanden und erschließen bereits neue Geschäftsfelder mithilfe ihres Datenkapitals. So bietet Amazon mit „Amazon Fresh“ in den USA Lebensmittel und Haushaltswaren auf Knopfdruck an: Kunden können beispielsweise in Seattle, Los Angeles und San Francisco aus rund 500.000 Produkten wählen, die Lieferung erfolgt innerhalb einer Stunde und in Sachen Frische und Preise ist das Angebot absolut konkurrenzfähig.

Google hingegen nutzt sein Wissen über Kunden und Risiken und steigt mit niedrigen Vertriebskosten in das Versicherungsgeschäft ein. Diese Aktivitäten sollten ein Weckruf für alle Firmen sein, die den Anschluss nicht verpassen wollen.

Um gegenüber solchen innovativen Dienstleistungen konkurrenzfähig zu bleiben, müssen Unternehmen bestehende Datenbestände verwerten und neue Datenströme aufbauen. Dabei besteht die Herausforderung nicht allein darin, die Datenmengen zu speichern, sondern sie einfach zugänglich und so in der Masse versteckte Informationen auswertbar zu machen. Big Data ungenutzt in den Systemen liegen zu lassen, ist wie totes Kapital auf der Bank. Aber wie bekommen Unternehmen ihre riesigen Datenmengen sinnvoll und mit möglichst geringem Aufwand in den Griff?

Den Wert der Daten erkennen

Viele Unternehmen haben bereits verstanden, wie wichtig der richtige Umgang mit ihren Daten ist und haben das eine oder andere Pilotprojekt dazu realisiert. Die nächste Stufe ist die richtige Auswahl und professionelle Durchführung einer Reihe von Big-Data-Projekten. Um in diesem Bereich nachhaltig effizient zu arbeiten, bedarf es der richtigen Strategie: Der zweistufige Prozess, den Oracle hierfür etabliert hat, bezeichnen wir als Data Lab und Data Factory.

Im Big Data Discovery Lab werden neue Projektvorschläge zunächst geprüft und bewertet. Relevante Daten müssen möglichst schnell untersucht werden, um zu erkennen, ob und wie man sie am besten auswertbar machen kann. Dazu werden zunächst Muster und Strukturen in den Rohdaten identifiziert. Das Ergebnis bildet die Basis für die Entscheidung, ob das Projekt realisierbar ist und wie es am besten in die nächste Phase weitergeführt werden kann: die Data Factory.

In der Big Data Factory geht es an die operative Umsetzung des jeweiligen Big Data Projekts mit einer breiteren Zielgruppe. Das kann innerhalb des Unternehmens geschehen oder mit Kunden.

Big Data statt „Big Frustration“

Allerdings gibt es einige Hürden, die das Big Data Discovery Lab und die Big Data Factory ausbremsen oder sogar stoppen können. Die erste besteht schon darin, die Rohdaten an sich im Discovery Lab in den Griff zu bekommen. Big Data ist von Natur aus unstrukturiert, ungeordnet und unvollständig.

Bevor über den geschäftlichen Nutzen von Daten nachgedacht werden kann, kommt zunächst die Inventur: Wo stehe ich mit meinen Daten? Wenn die Daten unsauber sind und in voneinander getrennten Datenbanken liegen, gilt es zunächst die Datenbasis zu bereinigen und zu konsolidieren. Dieser Vorgang beinhaltet zum Beispiel, die Schreibweise von Produktnamen oder Jobtiteln zu vereinheitlichen, Adressen in Geocodes umzuwandeln oder leere Datenfelder mit Nullen auszufüllen. In Big Data-Projekten nimmt diese Datenaufbereitung und -bereinigung nicht selten bis zu 80 Prozent der Projektlaufzeit in Anspruch.

Die zweite große Hürde bei der Durchführung von Big-Data-Projekten ist der enorme Mangel an Fachkräften. Laut einer Untersuchung des McKinsey Global Institute werden bis 2018 ca. 140.000 bis 180.000 Positionen für Datenspezialisten unbesetzt bleiben. Da überrascht es wenig, dass gemäß dem Prinzip von Angebot und Nachfrage die Gehälter sehr hoch und somit qualifizierte Mitarbeiter für Unternehmen entsprechend teuer sind.

IT-Unternehmen wie Oracle reagieren bereits auf diese Herausforderungen und entwickeln innerhalb ihres Produktportfolios Lösungen, die Big-Data-Projekte weniger komplex und kostenintensiv für die Unternehmen machen sollen. So begegnet das Tool Big Data Discovery von Oracle gezielt den beiden eben erläuterten Hürden. Oracle Big Data Discovery ist eine visuelle Oberfläche für die Hadoop-Datenbank. Sie nutzt die Leistungskraft von Hadoop und wandelt so Rohdaten innerhalb kurzer Zeit in strukturiert abfragbare Geschäftsinformationen um. Als zentraler Bestandteil des Big Data Discovery Lab sorgt das Tool für leistungsstarke Datenverarbeitung. Damit lässt sich der oben erwähnte Aufwand für Exploration und Transformation der Daten von 80 Prozent auf 20 Prozent reduzieren.

Engpässe entschärfen

Durch entsprechende Technologien sind Unternehmen nicht mehr zwangsläufig auf speziell ausgebildete Data Scientists angewiesen, sondern können die Aufgaben wie Datenexploration und -transformation an Business-Analysten oder Mitarbeiter in den Fachbereichen übergeben. Selbstverständlich werden Data Scientists für die weitere Analyse der Daten benötigt, jedoch kann der Engpass durch einfach zu bedienende Werkzeuge entschärft werden. Außerdem wird die Zusammenarbeit von Business-Analysten und Data Scientists mithilfe des Tools einfacher und effizienter.

Praxisbeispiel

Ein Beispiel für die gelungene Umsetzung eines solchen strategischen Projekts ist die Einführung einer umfangreichen Oracle-Big-Data-Infrastruktur bei der spanischen CaixaBank. Das größte Bankinstitut Spaniens verfügt mit 13,7 Millionen Kunden und 5.920 Filialen über eine entsprechend große Menge an Daten, die im Rahmen der ersten Projektphase in einem zentralen Verzeichnis erfasst wurden. Dieser einheitliche und sichere Datenpool liefert nun schnell und zielgenau umfassende Antworten auf beliebige Anfragen der Fachbereiche. Damit kann die Bank sowohl ihren Kundenservice als auch ihre Geschäftsergebnisse verbessern, denn sie hat jetzt ein umfassendes Bild von ihren Kunden.

Egal ob die Daten in der Filiale, im Internet, beim Telefonbanking oder am Geldautomaten erfasst wurden – sie sind für alle Unternehmensbereiche verfügbar und klar zugeordnet. Aufbauend auf der neuen Big Data Infrastruktur werden im nächsten Schritt zahlreiche Initiativen gestartet, von Verbesserungen der Risiko-Algorithmen und Bilanzkontrolle bis hin zur Optimierung von Prozessen.

Das Beispiel der CaixaBank macht deutlich, dass Unternehmen bezüglich Big Data einen ganzheitlichen Ansatz benötigen, der ihnen schnell und einfach zeigt, welches Potenzial in welchen Daten steckt. Denn wie gut Unternehmen ihr Datenkapital für den Geschäftserfolg nutzen, wird künftig ein entscheidender Wettbewerbsfaktor sein.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43579254 / Infrastruktur)