Big Data Trends 2015

Power to the People

| Autor / Redakteur: Quentin Gallivan / Nico Litzel

Der Autor: Quentin Gallivan ist CEO von Pentaho
Der Autor: Quentin Gallivan ist CEO von Pentaho (Bild: Pentaho)

„Data Blending“, das Verknüpfen von verschiedenen Datenquellen, ist für Quentin Gallivan einer der wichtigsten Trends 2015 im Bereich Big Data. Welche weiteren Trends der CEO des auf Business Intelligence Software spezialisierten Unternehmens Pentaho darüber hinaus identifiziert hat, verrät der folgende Gastbeitrag.

Im vergangenen Jahr hatte ich vorhergesagt, dass der Bedarf an Data Blending, also das Verknüpfen verschiedener Datenquellen, ein wichtiger Treiber für Big Data 2014 sein würde. Kunden wie Paytronix, RichRelevance oder NASDAQ, die ihre Big-Data-Implementierungen auf unserer Hausmesse PentahoWorld präsentierten, haben das bekräftigt. Und auch ein jüngster Bericht vom Analystenhaus Ventana Research (Ventana Research, Big Data Integration Report, Tony Cosentino und Mark Smith, Mai 2014) bestätigt, dass bei 22 Prozent der befragten Unternehmen mehr als 20 Datenquellen im Einsatz sind und 19 Prozent zwischen elf und 20 Datenquellen nutzen.2015 wird davon geprägt sein, dass diese Unternehmen noch mehr daran setzen werden, ihre Daten zu erkunden, eigene „Data Blends“ zu erstellen und dadurch noch schneller wertvolle Einsichten zu erhalten. Darauf bauen meine folgenden Vorhersagen:

Big Data trifft auf den „Big Blender“

Das digitale Universum breitet sich mit einer Geschwindigkeit aus, bei der selbst der Astronom und Astrophysiker Carl Sagan Schwierigkeiten hätte, diese in Worte zu fassen. Analysten gehen davon aus, dass sich das digitale Universum jedes Jahr verdoppelt. Noch stärker ist das Wachstum bei den unstrukturierten Daten: Diese verdoppeln sich alle drei Monate. Das Analystenhaus IDC (IDC, The Digital Universe of Opportunities: Rich Data and the Increasing Value of the Internet of Things, Gantz, Minton, Reinsel, Turner, April 2014) geht davon aus, dass bis 2025 etwa 40 Prozent des digitalen Universums von Maschinendaten und -schnittstellen generiert werden.

Die Anwendungsfälle, die Mehrwert für Unternehmen schaffen, entstehen nach unserer Erfahrung vor allem dann, wenn unstrukturierte Daten und traditionelle relationale Daten miteinander verknüpft werden. Einer der häufigsten Anwendungsfälle, bei dem wir Unternehmen helfen, ist die Schaffung einer 360-Grad-Kundensicht. Die Referenzarchitektur für diese Anwendung bedarf der Verknüpfung von relationalen Transaktionsdaten, die beinhalten, was der Kunde gekauft hat, mit unstrukturierten Weblog und Clickstream-Daten, die Kundenverhaltensmuster darüber aufzeigen, was vielleicht künftig erworben wird.

Zu diesem verknüpften Datensatz werden darüber hinaus Social-Media-Daten hinzugefügt, die die Stimmungen um Firmenprodukte und Kundendemografie wiedergeben. Diese große Verknüpfung von diversen Datenquellen zu einem Datensatz, auf Englisch auch „Big Blend“, wird in Empfehlungsplattformen eingegeben, um höhere Konversionsraten, gesteigerten Verkauf und eine bessere Kundenbindung zu erzielen.

Das Verknüpfen von Datenquellen schafft erst die Voraussetzung für andere Big-Data-Anwendungsfälle wie das „Internet of Things“, Sicherheit- und Intelligence-Applikationen, Supply Chain Management und Regulierungs- und Compliance-Anforderungen in Branchen wie Finanzdienstleistungen, Gesundheitswesen oder Telekommunikation.

Internet of Things als Treibstoff für das „Industrial Internet“

Die ersten Big-Data-Anwendungen hatten neue Geschäftsmodelle hervorgebracht, wie zum Beispiel von unseren Kunden BeachMint und Paytronix. Ich bin davon überzeugt, dass wir 2015 sehen werden, wie Big Data das traditionelle Industriegeschäft durch operative, strategische und Wettbewerbsvorteile transformiert. Deutschlands ambitioniertes Industrie-4.0-Projekt geht in die Richtung, wie auch die „Industrial-Internet“-Bewegung in den USA.

Maschinengenerierte Daten von Sensoren und Geräten, die Smart Homes, Smart Cities oder Smart Medicine ermöglichen, basieren wie die „Industrial-Internet“-Bewegung auf dem „Internet of Things“ und benötigen alle Big-Data-Analysen. Laut dem Analystenhaus Wikibon (Wikibon, Defining and Sizing the Industrial Internet, David Floyer, Juni 2013) wird bis 2020 aus Maschinendaten ein Effektivitätswert von fast 1,3 Billionen US-Dollar gezogen und Maschinendaten werden als Treiber hinter 514 Milliarden US-Dollar an IT-Ausgaben stehen. Engpässe werden durch Herausforderungen im Bereich Datensicherheit, Data Governance, Datensilos und Systemintegration entstehen.

Big Data und die Cloud

Da immer mehr Firmen mit großen Datenmengen versuchen, in elastischeren Umgebungen zu operieren, werden wir immer häufiger Big-Data-Infrastrukturen sehen, die komplett oder teilweise in der Cloud laufen. Die Cloud wird jetzt immer häufiger auch von der IT-Abteilung als sicherer, geschützter und flexibler Ort fürs Daten-Hosting akzeptiert. Während unserer Hausmesse PentahoWorld habe ich eine Geschichte über einen großen Big Data Showdown erzählt, den wir auf einer Sitzung unseres Strategic Advisory Boards erlebt haben. Zwei unserer Kunden aus einer stark regulierten Branche haben versucht, sich darin zu überbieten, wer mehr Daten in der Amazon Redshift Cloud speichert.

Der eine Kunde verarbeitet und analysiert fünf bis sieben Milliarden Datensätze täglich. Der andere Kunde speichert täglich ein halbes Petabyte an Neudaten und muss die Daten sieben Jahre aufbewahren und gleichzeitig für schnelle Analysen zur Verfügung stellen. Beide Kunden müssen strenge Standards für Data Governance und Compliance erfüllen und nutzen die Cloud als Big-Data-Umgebung.

Eingebettete Analysen sind das neue BI

Obwohl es die traditionelle Business Intelligence (BI), bei der ein Business Analyst die Daten mit einem separaten Tool außerhalb der Applikationen untersucht, sicherlich noch eine ganze Weile geben wird, sehen wir den Trend, dass Geschäftsanwender immer häufiger in Applikationen eingebettete Analysen nutzen. Untersuchungen von Gartner (Gartner, Use Embedded Analytics to Extend the Reach and Benefits of Business Analytics, Daniel Yuen, Oktober 2014) schätzen, dass mehr als die Hälfte der Unternehmen, die BI nutzen, eingebettete Analysen verwenden.

Egal ob ein Data Scientist von RichRelevance einen prognostischen Algorithmus für die Recommendation Engine erstellt oder ein Marketingleiter in Marketo die Effektivität seiner Kampagnen analysiert; die Art und Weise, wie unsere Kunden unsere Lösung einsetzen, lässt mir keine Zweifel, dass sich diese Vorhersage erfüllen wird.

Mit fortschreitender Marktreife des traditionellen BI-Marktes haben wir ein großes Finale erlebt, wo Geschäftsanwender sich durch Datenvisualisierung und Self Service BI erst das gesamte Potenzial für erweiterte Analysen vorstellen konnten. Das hat den Markt auf das vorbereitet, was ich als wichtigsten Big Data Trend in 2015 sehe.

„Daten-Raffinerien“ bringen „Power to the People“

Für Big Data steht mehr auf dem Spiel als jemals zuvor. Es geht nicht mehr darum, virtuelles Kapital wie Sentiment und Prioritäten zu quantifizieren. Vielmehr beginnt die Big-Data-Analyse uns Auskunft darüber zu geben, wie wir Aktivposten wie Inventar, Maschinen und Energie verwalten. Das heißt aber auch, dass Unternehmen ihren Fokus auf den traditionellen Extract-Transform-Load-Prozess (ETL) richten müssen, aus dem sich erst sichere, saubere und vertrauenswürdige Daten ergeben.

Für die genannten Big-Data-Anwendungsfälle muss der traditionelle ETL-Prozess aber schneller, einfacher, skalierbarer, für die Cloud besser nutzbar und für Geschäftsanwender zugänglicher gemacht werden. Eine optimierte Datenaufbereitungsarchitektur, auf Englisch „Streamlined Data Refinery“, könnte 2015 dieses Hindernis überwinden und dabei helfen, das volle operative Potenzial von Big Data auszuschöpfen.

Kommentar zu diesem Artikel abgeben
Weitere Jahrestrends auf BigData-Insider.de: - Sage - Mindbreeze  lesen
posted am 20.01.2015 um 15:57 von Unregistriert


Mitdiskutieren

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43149961 / Analytics)