Big Data und IoT im Blick

Rückblick auf die Cloudera Sessions in Frankfurt

| Autor / Redakteur: Thomas Schumacher / Nico Litzel

Christoph Reininger, Head of BI bei Runtastic, ließ zur allgemeinen Überraschung das ganze Auditorium zum Aufwärmen Kniebeugen machen, erst danach startete er seine Präsentation.
Christoph Reininger, Head of BI bei Runtastic, ließ zur allgemeinen Überraschung das ganze Auditorium zum Aufwärmen Kniebeugen machen, erst danach startete er seine Präsentation. (Bild: T. Schumacher)

Zweimal im Jahr lädt Cloudera zu seinen Sessions ein, auf denen externe sowie eigene Experten rund um Hadoop, Big Data & Co. Ein- und Ausblicke geben. Die aktuellen Sessions fanden in der vergangenen Woche in Frankfurt statt und rund 120 Teilnehmer sorgten für ein volles Haus.

Erster Referent war ClouderasBig Data Evangelist“ Clarke Patterson, der in seiner Keynote über „Big Value from Big Data“ referierte. Anhand von Airbnb, Facebook, Spotify und Uber machte er deutlich, wie der richtige Umgang mit Big Data für Veränderung in zahlreichen Branchen führt. Aus seiner Sicht verändere sich das Verhältnis zu Daten und für Unternehmen werden diese immer mehr zu einem strategischen Asset. Big Data ermöglicht nach seiner Erfahrung bessere Geschäftsprognosen und einen detaillierteren Blick auf Kunden. Die Erkenntnisse über Kunden ließen sich in dem Trendbegriff „360-Grad-Sicht“ zusammenfassen.

Clouderas Big Data Evangelist Clarke Patterson referierte in seiner Keynote über „Big Value from Big Data“.
Clouderas Big Data Evangelist Clarke Patterson referierte in seiner Keynote über „Big Value from Big Data“. (Bild: T. Schumacher)

Was das praktisch bedeutet, führte Patterson am Beispiel der britischen Supermarktkette Marks & Spencer aus, die damit unter anderem die Abbruchquote in ihrem Online-Shop erheblich reduzieren konnte. Die Kreditkartenfirma MasterCard konnte wiederum mit der ersten (und bislang einzigen) durch die Payment Card Industry (PCI) zertifizierten Hadoop-Plattform ihre Geschäftsrisiken deutlich reduzieren. MasterCard sichert täglich zehn Petabytes an Daten PCI-compliant. Bei der Modernisierung der Architektur führe kein Weg an Hadoop vorbei, Unternehmen riet Patterson, den Schritt zu umfassenden Analysen („pervasive analytics“) zu gehen und den Blick nach vorn Richtung Zukunft zu richten. Insbesondere die Themen IoT und Machine Learning werden die Big-Data-Analyse in naher Zukunft stark beeinflussen.

Vorträge von IDC, Runtastic und T-Labs

Das Internet of Things als zentraler Erfolgsfaktor der digitalen Transformation war Thema des folgenden Vortrags des IDC-Analysten Matthias Zacher. Auch er wies zu Beginn auf den Umbruch hin, den die digitale Transformation für Branchen und Geschäftsmodelle bedeutet, hob aber vor allem die Möglichkeiten hervor, durch Digitalisierung interne Prozesse effizienter zu gestalten, Kundenbeziehungen zu verbessern und neue Umsatzmöglichkeiten zu finden.

Der IDC-Analyst ging noch einen Schritt weiter mit seiner These, dass ALLE Branchen vom IoT profitieren werden. Als konkrete Bereiche nannte er Smart Citys, Smart Industry und Smart Living. Das Wachstum bei den „Dingen“ sei enorm, wie Zacher anhand einer Untersuchung aus dem eigenen Hause belegte: Bis 2019 werde sich demnach die Zahl der Objekte im IoT mehr als verdoppeln, von aktuell 12,1 Milliarden auf 25,6 Milliarden. Eine Schlüsselrolle spielten dabei IoT-Analytics, der Fokus bei Analysen verschiebe sich immer stärker in Richtung „Things“. Die damit verbundene Einbindung von Analytics in die Geschäftsprozesse bezeichnete Zacher als „IoT 2.0“.

IDC-Analyst Matthias Zacher erklärte in seinem Vortrag, warum das Internet of Things ein zentraler Erfolgsfaktor der digitalen Transformation ist.
IDC-Analyst Matthias Zacher erklärte in seinem Vortrag, warum das Internet of Things ein zentraler Erfolgsfaktor der digitalen Transformation ist. (Bild: T. Schumacher)

Runtastic schafft aus Daten „Value“

Im Anschluss betrat Christoph Reininger, Head of BI bei Runtastic, die Bühne. Reininger hat 2013 die BI-Abteilung bei Runtastic gegründet. Seine Aufgabe ist es, Architektur- und Analyseprojekte zu managen und letztlich Ansätze zu finden, aus Daten bei Runtastic „Value“ zu schaffen. Zuerst einmal ließ er allerdings zur allgemeinen Überraschung das ganze Auditorium zum Aufwärmen Kniebeugen machen, erst danach startete er seine Präsentation.

Runtastic setzt in seinem „Massive Data Store“ auf eine Infrastruktur, in deren Zentrum Hadoop steht. Ein kontinuierlicher Strom an Daten fließt in Hadoop, die Daten werden in einem ersten Schritt mit Hive aufbereitet und in ein Data-Warehouse geladen, für die direkte Erkundung der Daten wird Impala eingesetzt. Zentrales Werkzeug in der „Data Product Factory“, deren Aufgabe die Nutzung der Daten ist, ist Spark.

Christoph Reininger, Head of BI bei Runtastic
Christoph Reininger, Head of BI bei Runtastic (Bild: T. Schumacher)

Reininger skizzierte in seinem Vortrag den „Data Factory Production Process“: Am Anfang stehe eine Idee, welche Analysen Runtastic oder den Nutzern der App einen Mehrwert bieten könnte. Im nächsten Schritt werden zu der abstrakten Idee Anforderungen und Ziele definiert, auf deren Basis die Data Scientists ein Experiment als Prototyp starten. Wenn das erfolgreich abläuft, geht das Projekt in die Data Product Factory zur Umsetzung in die Produktionsreife. Als Beispiel nannte Reininger ein Projekt zum „Customer Churn“: Wie lassen sich Nutzerdaten so interpretieren und behandeln, dass die Abwanderung von Kunden proaktiv verhindert werden kann?

Forschungseinrichtung T-Labs

Einen hochinteressanten Einblick in die Forschungseinrichtung T-Labs der Deutsche Telekom AG gab im Anschluss daran Dr. Christian Weiss. Mit dem „DataLab“ betreiben die T-Labs einen kompletten Stack, um die Entwicklung von Data Intelligence und letztlich Innovationen zu fördern. Die T-Labs haben ein System etabliert, um Einsatzszenarien für Big Data nach bestimmten Kriterien zu beurteilen und Ansätze zu finden, den maximalen Wert aus Big Data zu ziehen.

Dr. Christian Weiss gab einen hochinteressanten Einblick in die Forschungseinrichtung T-Labs der Deutsche Telekom AG.
Dr. Christian Weiss gab einen hochinteressanten Einblick in die Forschungseinrichtung T-Labs der Deutsche Telekom AG. (Bild: T. Schumacher)

Ziel ist der Transfer in die Produktionslandschaft der Deutschen Telekom, unterstützt werden die Bereiche Energie, Smart Home, Automotive, M2M und Core Telco. Für Big-Data-Projekte skizzierte Dr. Weiss das Modell eines Smart DataLab auf Basis eines „Cluster as a Service“. Über eine eigen entwickelte Oberfläche könnten Kunden für jeden Anwendungsfall selbst ein Cluster anpassen, Cloudera Enterprise installieren und nach Bedarf Service wie beispielsweise HDFS, Impala oder HBase einrichten. Verschiedene Analyse-Tools sorgen dafür, dass Data Scientists sehr schnell mit ihrer Arbeit starten können.

Ein weiteres wichtiges Forschungsfeld betrifft auch bei den T-Labs das Thema IoT, das Dr. Weiss als Schnittmenge aus Sensoren, Maschinen und Telco-Infrastruktur darstellte. Als praktische Beispiele nannte er dann unter anderem die Überwachung des Fahrverhaltens im Bereich Automotive, Predictive Maintenance und neue Business-Modelle im Smart-Home-Bereich oder den Einfluss der Netzwerkkomplexität auf Ausfälle im Energiesektor.

Podiumsdiskussion und Breakout Sessions

Martin Czermin, Geschäftsführer Cloudera, moderierte eine Podiumsdiskussion mit Vertretern von Datameer, Intel Deutschland, Lufthansa Industry Solutions AS, IDC Central Europe, Runtastic und SAS Institute.
Martin Czermin, Geschäftsführer Cloudera, moderierte eine Podiumsdiskussion mit Vertretern von Datameer, Intel Deutschland, Lufthansa Industry Solutions AS, IDC Central Europe, Runtastic und SAS Institute. (Bild: T. Schumacher)

Das Internet of Things war dann auch Thema der von Martin Czermin, Geschäftsführer Cloudera, moderierten Podiumsdiskussion mit Vertretern von Datameer, Intel Deutschland, Lufthansa Industry Solutions AS, IDC Central Europe, Runtastic und SAS Institute. Nach kurzer Pause fanden drei Breakout Sessions, geleitet von Cloudera-Mitarbeitern, statt. Daniel Tydecks gab in seinem Vortrag einen Überblick über die Grundlagen von Hadoop und Spark, während Rüdiger Schickhaus in seiner Session zu „Architekturmodernisierung: Neue Ansätze beim Data Engineering mit Apache Hadoop“ schon in die Tiefe ging. Seine Fragestellung war, wie Daten in das Hadoop-System kommen. Dabei stellte er die klassischen Tools Sqoop und Flume vor, um danach ausführlich Apache Kafka als moderne Basis für Echtzeit-Architekturen vorzustellen. Wie lässt sich Cybersecurity im Petabyte-Maßstab realisieren? In der dritten Session sprach Guido Oswald zum Thema „Apache Hadoop trifft auf Cyber-Sicherheit“. Ergänzend stellte Dr. Carlo Gebhardt von Accenture Deutschland die “Accenture Cyber Intelligence Platform” als Beispiel für eine moderne Cybersecurity-Architektur vor.

Fortsetzung im Oktober

Wer nun meint, etwas verpasst zu haben: Die nächsten Cloudera Sessions finden im Oktober in München statt. Man darf gespannt sein, was dann statt Kniebeugen zum Aufwärmen auf der Agenda steht.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 44106532 / Infrastruktur)