Nachbericht von den Cloudera Sessions in München

„Daten ermöglichen, was bisher unmöglich war”

| Autor / Redakteur: Thomas Schumacher / Nico Litzel

Über 300 Gäste durfte Cloudera bei den Cloudera Sessions 2017 in München begrüßen. In zahlreichen Keynotes erfuhren die Teilnehmer von Partnern und Kunden des Unternehmens mehr über zukunftsweisende Projekte aus den Bereichen Machine Learning, Künstliche Intelligenz und Analytics.
Über 300 Gäste durfte Cloudera bei den Cloudera Sessions 2017 in München begrüßen. In zahlreichen Keynotes erfuhren die Teilnehmer von Partnern und Kunden des Unternehmens mehr über zukunftsweisende Projekte aus den Bereichen Machine Learning, Künstliche Intelligenz und Analytics. (Bild: Cloudera)

Über 300 Teilnehmer durfte Cloudera bei den diesjährigen Cloudera Sessions in den Eisbach Studios in München begrüßen. Thematisch standen die Sessions in diesem Jahr im Zeichen der Trendthemen Machine Learning, Künstliche Intelligenz und Analytics. Cloudera-Partner und hochkarätige Vertreter der deutschen Wirtschaft hatten sich angekündigt, um zukunftsweisende Projekte aus ihrem Haus vorzustellen.

Mike Olson
Mike Olson (Bild: Cloudera)

Nach einer Begrüßung durch Wolfgang Huber, den neuen Leiter des Deutschlandgeschäfts von Cloudera und damit auch Gastgeber der Sessions, betrat Cloudera-Mitgründer und CSO Mike Olson die Bühne. In seiner spannenden Keynote wies er anfangs darauf hin, dass Unternehmen bei der Erschließung ihrer Datenbestände noch großen Nachholbedarf und damit auch noch enormes Potenzial hätten. „Wir glauben, dass morgen mit Daten Dinge möglich sind, die heute noch unvorstellbar sind”, so Mike Olson. Seiner Keynote zufolge werden weniger als 50 Prozent der strukturierten Daten aktiv zur Entscheidungsfindung herangezogen, bei den unstrukturierten Daten würden gar weniger als ein Prozent überhaupt genutzt. Auf der anderen Seite hätten über 70 Prozent der Mitarbeiter in Unternehmen Zugriff auf Daten, die sie eigentlich nicht sehen sollten und 80 Prozent der Analysten würden ihre Zeit eben nicht für Analysen aufwenden, sondern um Daten zu entdecken und aufzubereiten.

Diese Herausforderung werde angesichts der explodierenden Zahl an IoT-Geräten und den damit verbundenen Datenströmen noch zunehmen. Olson zitierte eine IDC-Studie, der zufolge bis 2020 rund 30 Milliarden vernetzte Geräte existieren und für eine Vervielfachung der Daten um den Faktor 440 sorgen sollen. Das Marktvolumen schätzt IDC bis dahin auf etwa 220 Milliarden US-Dollar. Olson stellte auch Beispiele vor: Der US-LKW-Hersteller Navistar etwa erfasst mit Clouderas Plattform IoT- und Telematikdaten von Sensoren in mehr als 250.000 Fahrzeugen, aber auch Daten zu Wetter, Technik, Verkehr und Fahrzeugnutzung. Durch die Analyse dieser Daten konnte Navistar die Wartungskosten und Ausfallzeiten um beinahe 40 Prozent reduzieren.

Anschließend stellte Olson noch die neuesten Ergänzungen der Plattform vor: Die Data Science Workbench, SDX und Cloudera Altus. Der Trend ist eindeutig: In Zukunft wird die Datenanalyse einfacher und kostengünstiger, durch Machine Learning und Künstliche Intelligenz leistungsfähiger und durch Cloud-Services praktisch grenzenlos skalierbar. In puncto KI und Machine Learning fügte Mike Olson noch an, dass Cloudera aktuell deutlich mehr Kunden habe, die Machine Learning produktiv nutzen, als IBM mit seiner KI „Watson”.

Vorträge Kunden und Partner

Nach Mike Olsons Auftritt gehörte die Bühne in den Eisbach Studios den Kunden und Partnern von Cloudera. Den Anfang machte dabei Stephan Gillich, Director of Technical Computing and AI GTM EMEA bei Intel. Die Verbindung zwischen Cloudera und Intel geht über eine Technologiepartnerschaft hinaus: Intel ist einer der größten Anteilseigner von Cloudera. Gillich wies in seinem Vortrag insbesondere auf die Rolle der technischen Infrastruktur für die Datenanalyse hin. Die Basis für leistungsfähiges und sicheres Machine bzw. Deep Learning sei immer die Hardware, auf der dann eine Datenplattform wie Cloudera aufsetze. Hier bietet Intel mit seinem Nervana-Portfolio eine auf Künstliche Intelligenz abgestimmte Palette an Produkten und Services, die Performance und Skalierbarkeit auch für die komplexesten Projekte bereitstellt.

Einen interessanten Blick auf die Themen Governance und Compliance warf Katharine Jarmul, Data Scientist und Gründerin von Kjamistan in ihrer Keynote „GDPR: Welche Vorteile hat die neue Regulierung?”. Mit GDPR werde von Unternehmen erwartet, dass Informationen organisiert, gekennzeichnet und ordnungsgemäß gesichert verarbeitet sowie auch gespeichert werden. Jarmul warf dabei auch die Frage auf, ob Künstliche Intelligenz damit ab dem kommenden Jahr in Europa illegal wird. Zur Erleichterung vieler Fachbesucher wird das nicht der Fall sein. Voraussetzung sei aber, dass Unternehmen die Betreuung der Daten im Sinne der neuen Regulierung organisieren, Machine Learning müsse ethisch, interpretierbar und nachvollziehbar sein. Die GDPR könne demnach für Unternehmen der initiale Faktor zur Einrichtung einer organisierten Data-Governance sein. So kann selbst eine Regulierung für Unternehmen etwas Gutes bewirken.

Volkswagen und MAN: Connected Vans, abteilungsübergreifende Teams

Nach einer kurzen Networking-, Raucher- und Kaffeepause stellten Dr. Michael Nolting von Volkswagen und Dr. Robert Neumann von Ultra Tendency das VW-Projekt „Smart Data for Connected Van” vor. Daten werden beim Connected-Van-Projekt hauptsächlich in drei Bereichen benötigt: Bei der Elektrifizierung (z. B. zur dynamischen Reichweitenberechnung oder für Karten), für autonomes Fahren (z. B. Karten, Echtzeitaktualisierungen) und zur weiteren Optimierung der logistischen Wertschöpfungskette (z. B. um Staus aufzulösen, bevor sie entstehen).

Speziell beim autonomen Fahren müsse zudem zwischen „Fast Data” und „Slow Data” unterschieden werden: Während einige Kartenaktualisierungen und Staus in Echtzeit angezeigt werden müssen, spiele Geschwindigkeit keine so große Rolle, wenn es um Änderungen am Kartenmaterial wie etwa geänderten Verkehrszeichen geht, wo sich pro Jahr nur etwa zehn Prozent Änderungen ergeben.

Die unterschiedlichen Anforderungen an Slow und Fast Data spiegeln sich auch in der Infrastruktur wider: Bei den schnellen Daten kommen Spark-Streaming und Structured Streaming mit Kafka zum Einsatz, während bei den langsamen Parquet und Spark SQL mit Impala als Ziel-Datenbank genutzt werden. Der Clou am VW-Projekt: Die Workloads laufen dank Cloudera Altus vollständig in der Cloud.

Einen interessanten Aspekt behandelten Stefan Strehlow und Dr. Thomas Eichner von MAN Truck & Bus: Um Big Data „sicher auf die Straße bringen” zu können, müssen zuerst die internen Prozesse und Zuständigkeiten geklärt werden. Dazu hat MAN die Data Scientists mit anderen Stakeholdern aus dem Unternehmen an einen Tisch gebracht, insbesondere betraf dies die Bereiche IT-Security, Datenschutz, Lega und Mitbestimmung. Im so genannten „MAN Data Governance Council” werden in monatlich stattfindenden Treffen Use Cases und die erforderlichen Daten diskutiert. Der gemeinschaftliche Ansatz hat sich als zielführend und effektiv herausgestellt.

Versicherungskammer Bayern: Und jetzt zum Wetter…

Technisch wurde es wieder im sich anschließenden Vortrag von Bai Xia und Robert Gunreben von der Versicherungskammer Bayern (VKB), dem größten öffentlichen Versicherer in Deutschland. Digitalisierung und insbesondere Data Analytics betrachtet die VKB als Mittel zur nachhaltigen Stärkung des Geschäftsmodells. Konkret wurden dazu vier Bereiche genannt: Künstliche Intelligenz & Automatisierung, Risikominimierung durch Prognosen, Kognitive Unterstützung für Mitarbeiter sowie die Vernetzung der Dienstleistungen, Plattform und Ökosysteme.

Betont wurde von den Referenten insbesondere der positive Einfluss der Data-Analytics auf den Kundenwert entlang der Customer Journey. Als Use-Case stellte Bai Xia die Schadensprognose bei Gebäudeversicherungen auf Basis von Wetterdaten vor, konkret am Beispiel des Sturms „Kyrill”. Die Wetterdaten helfen der VKB, für definierte Gebiete die Schadenswahrscheinlichkeit und die Schadenhöhe zu kalkulieren. Dabei wurde der Algorithmus mit historischen Wetterdaten „gefüttert”, um per Machine Learning Muster zu erkennen und Rückschlüsse aus aktuellen Daten ziehen zu können.

Digitale Kreditvergabe und das Content Lab der Deutschen Börse

Über die Digitalisierung des Kreditprozesses bei einer großen deutschen Privatkundenbank sprach danach Olaf Hein vom Cloudera-Partner Ordix AG. Im Projekt „Fast Analytics on Fast Data” setzt Ordix auf Apache Kudu als Storage-Layer für die Bankanwendungen. Im Vergleich mit Hadoop und HBase zeigte sich Kudu als optimale Wahl für diesen Einsatzzweck.

Als letzter Vortragender betrat danach Konrad Sippel von der Deutschen Börse die Bühne. In seinem Vortrag drehte sich alles (und das ist wörtlich zu verstehen, als einziger Speaker trat Konrad Sippel mit einer animierten Prezi-Präsentation auf) um den Begriff „Datafication”. Darunter versteht die Deutsche Börse das Sammeln, Analysieren von Daten und Ausbringen daraus abgeleiteter Erkenntnisse, um über alle Geschäftseinheiten hinweg Kundenerfahrung, Produkte, Prozesse und den Betrieb zu verbessern.

Im Zentrum der Datafication steht das „Content Lab”, in dem ein interdisziplinäres Team aus Data Scientists und Data Engineers Anwendungsfälle entwickelt. Einer der bereits fertig entwickelten Prototypen deckt das Thema „Payment Fraud Detection” ab, weitere, zum Teil sehr komplexe Use Cases sind noch im Entwicklungsstatus. Die Big-Data-Architektur ist zu 100-Prozent Cloud-basiert und setzt auf die Cloudera Data Science Workbench und Trifacta als Schlüsselkomponenten.

Zur Vertiefung: Zwölf Breakout Sessions von Cloudera und Partnern

Um die gesammelten Eindrücke „sacken” zu lassen, ging es dann erst einmal in die Mittagspause, die auch für Networking und Gespräche in der „Partner-Zone” genutzt wurde, gefolgt von einem Nachmittag mit insgesamt zwölf Breakout Sessions von Cloudera und Partnern zu den Themen ML/ AI & Data Science, Industrie 4.0, Cloud sowie BI & Cloud Analytics. Am Ende eines langen Sessions-Tages war klar: „Daten ermöglichen, was bisher unmöglich war.”

Darüber und über die vielen Use-Cases sowie die Möglichkeiten im eigenen Unternehmen diskutierten viele Teilnehmer noch mit einem Weißbier, Wein oder Mojito in der Hand. Die präsentierten Themen beschäftigen die Experten und werden das auch noch eine ganze Weile tun – neuen Input dafür boten die Sessions im Übermaß.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44954574 / Infrastruktur)