Nachbericht Cloudera Sessions

„Deutschland ist einer der wichtigsten Märkte für uns“

| Autor / Redakteur: Ariane Rüdiger / Nico Litzel

„Deutschland ist für uns ein sehr wichtiger Markt“, erklärt Mike Olson, Gründer und CEO von Cloudera.
„Deutschland ist für uns ein sehr wichtiger Markt“, erklärt Mike Olson, Gründer und CEO von Cloudera. (Bild: Rüdiger)

Cloudera, der derzeit führende Anbieter einer Hadoop-Distribution, versammelte Kunden und Partner in der Münchner Allianz-Arena zur Veranstaltung „Cloudera Sessions“. Das Unternehmen hatte einige Neuigkeiten im Gepäck.

Mit der Verbreitung von Big Data Analytics werden auch die entsprechenden Hadoop-Distributionen immer wichtiger. Um den Kuchen streiten sich derzeit vor allem die drei Spezialisten Cloudera, MapR und Hortonworks.

Hortonworks ist dabei der einzige Player, der derzeit konsequent auf Open Source setzt und MapR hat Stärken im Bereich Hochverfügbarkeit. Doch die größte Überzeugungskraft geht aktuell anscheinend von Cloudera aus. Mitgründer und CEO Mike Olson verweist auf die Zahlen unterschiedlicher Marktforscher, denen gemäß Cloudera 50 bis über 78 Prozent Anteil am weltweiten Markt für Hadoop-Software hat.

„Europa ist unser am schnellsten wachsender Markt“, sagte Olson im Interview mit BigData-Insider. Und besonders wichtig sei hier Deutschland. Das Land habe große, ausgereifte und international aktive Unternehmen – genau in Branchen wie Automotive, in denen viele Daten entstünden, etwa durch das Internet der Dinge, und auf die sich Cloudera deswegen fokussiere. Zudem gebe es hier eigenständige IT-Unternehmen mit Stärken im Big-Data-Bereich, etwa SAP.

Schneller und reibungsarmer Einstieg

In den USA habe man so viele Erfahrungen gesammelt, sodass Clouderas Big-Data-Plattform nun reif sei und den Kunden einen relativ schnellen und reibungsarmen Einstieg in die Technologie gestatte. „Der deutsche Markt wird von unseren US-Erfahrungen profitieren“, meint Olson. Über kurz oder lang werde der europäische Markt für Cloudera hinsichtlich des Umsatzes genauso wichtig wie der US-Markt.

In München rief der Anbieter seine Kunden und Partner im Oktober in die Allianz-Arena zur ersten Cloudera Sessions zusammen. Diverse Vorträge und eine Podiumsdiskussion informierten die zahlreichen Besucher über Neuigkeiten und Anwendererfahrungen. An der angeschlossenen Ausstellung nahmen Hardwarepartner wie HP, EMC oder Teradata, aber auch Anbieter von Big Data Software wie Datameer teil.

Olson konnte den Kunden von drei neuen Projekten berichten, mit denen Cloudera zur Funktionserweiterung von Hadoop beiträgt: Bereits seit zwei Jahren investiert Cloudera intensiv in Spark, das Analysetool für Echtzeitdaten aus der Hadoop-Familie. „Wir haben fünf Committers in unserem Unternehmen, nur Databricks hat mehr“, sagt Olson. Mit Spark soll es möglich werden, die Unmengen an Echtzeitdaten, die beispielsweise in IoT-Umgebungen entstehen, zeitnah zu analysieren und Informationen aus ihnen zu gewinnen. Derzeit arbeite man an der Verbesserung diverser Funktionen, die für professionelles Arbeiten nötig sind: Sicherheit, Skalierbarkeit, Geschwindigkeit und Managementmöglichkeiten.

Kudu

Die zweite Neuerung ist Kudu, ein System, das neben die Filesysteme HDFS (spaltenweise Analyse) und Hive (Analyse einzelner Records) treten und strukturierte Daten analysieren soll. Warum das, wenn es doch schon Oracle, IBM und andere gibt? Olson: „Konventionelle Datenbanken skalieren auf acht oder zehn Knoten, Kudu auf Tausende.“ So könne man die Daten wesentlich längerer Zeiträume zur Analyse heranziehen.

Auch hier ist einer der Zielmärkte das IoT, denn Sensoren erzeugen für gewöhnlich strukturierte Daten, wie sie Kudu wird verarbeiten können. Platz für relationale Datenbanken bleibe trotzdem. Denn Funktionen wie eine sichere Transaktionsverarbeitung seien, so Olson, nur schwer integrierbar. Die Entwicklung von Kudu erfolgt Open Source.

Bereits in einer Beta-Version verfügbar ist „RecordService“, eine auf Apache Sentry aufbauende Middleware, mit der sich die Zugriffsrechte für in Hadoop gespeicherte Daten unabhängig vom gewählten Zugriffs- und Suchsystem zentral verwalten lassen. Hier ist in der ersten Hälfte 2016 mit einer finalen Version zu rechnen.

Interessant war, was Cloudera-Kunden über ihre Erfahrungen mit Big Data berichteten. Beim Pharmariesen F. Hoffmann-La Roche berichtete Simon Ulrich, Head of Business Intelligence & Master Data Management des Unternehmens, habe man zunächst keine großen Investitionen getätigt, sondern beispielsweise alte Hardware für Big-Data-Experimente umgewidmet.

Schnellere Genomanalysen

Ulrichs: „Man muss Vieles ausprobieren, und Vieles stellt sich als nicht sinnvoll heraus. Das sollte man schnell beenden.“ Allerdings habe man auf diese Weise diverse, langfristig sehr sinnvolle Projekte identifizieren können. Beispielsweise lassen sich die Ergebnisse von Genomanalysen, die man braucht, um maßgeschneiderte Medikamente für bestimmte Patientengruppen mit ähnlichen individuellen Merkmalen zu entwickeln, um ein Vielfaches beschleunigen. Auch die Analyse von Versuchsdaten geht jetzt schneller.

Nachdem anfangs zuerst Analysefragen entwickelt und dann die Daten untersucht wurden, beginne man langsam, „die Daten sprechen zu lassen“, sprich: zu erkennen, ob man bei der Analyse bisher unentdeckte Muster finden könne, die völlig neue Möglichkeiten eröffnen. Wesentlich sei es, die Big-Data-Umgebung den Anwendern in der Pilotphase kostenlos zur Verfügung zu stellen. Nur so lasse sich verhindern, dass hinter dem Rücken der IT eine „graue“ Analyselandschaft unter den Schreibtischen der Fachabteilungen entstehe.

Beim Versandhändler Otto legte man besonderen Wert auf ein strukturiertes Vorgehen beim Aufbau der Big-Data-Landschaft, sodass den Kunden des IT-Bereichs auf allen Ebenen – von der Datenanalyse bis um Real-Time-Marketing – maßgeschneiderte Big-Data-Dienstleistungen bereitgestellt werden können. Außerdem entwickelte Otto eine Big Data Scorecard, um die Leistungen des Bereichs zu bewerten. Hier geht es um Reaktionsgeschwindigkeit (Stunden statt Tage), die Steigerung des Informationskapitals, bessere Entscheidungen und intensivere Informationsnutzung, berichtete Rupert Steffner, Chief BI und Platform Architect bei Otto.

Datenanalysen beeinflussen wesentlich Entscheidungen

Andreas Bitterer, Vice President und Research Fellow beim auf BI-Themen spezialisierten Marktforschungsunternehmen BARC, präsentierte aktuelle Ergebnisse einer Marktuntersuchung zu Big Data, an der 550 Unternehmen unterschiedlicher Größen und Branchen vorwiegend aus dem deutschsprachigen Raum, Nordamerika und Europa teilgenommen hatten. Dabei ergab sich, dass in über 60 Prozent der Unternehmen Datenanalysen Entscheidungen bereits wesentlich beeinflussen.

Vor allem erhoffen sich die Unternehmen, mithilfe der neuen Analytics-Technologien der großen Datenmengen besser Herr zu werden (57 Prozent), neue und bessere Analysen zu erhalten (55 Prozent), Prognosemodelle zu entwickeln (50 Prozent) und auch polystrukturierte Daten analysieren zu können (50 Prozent). Dabei sind IT und Management (45 bzw. 43 Prozent) die wesentlichen Treiber. Wichtigste Probleme sind noch immer mangelnde Fachkenntnisse in der Datenanalyse (53 Prozent) und den zugrunde liegenden Technologien (48 Prozent) sowie Datenschutz (49 Prozent) und Datensicherheit (48 Prozent).

Für das Problem der fehlenden Fachleute, darauf wies Ulrich nachdrücklich hin, finden sich manchmal sehr überraschende Lösungen. „Man weiß einfach nicht, wer ein guter Datenanalyst wird und muss deshalb überall im Unternehmen suchen und dann weiterbilden. Einer unserer besten Analysten war vorher im Compliance-Bereich und kontrollierte dort Dokumente auf richtige Schreibweise.“

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43650807 / Infrastruktur)