Nachbericht Hortonworks-Roadshow in München

Ein Hadoop-Server in jedem Fahrzeug

| Autor / Redakteur: Ariane Rüdiger / Nico Litzel

Reges Interesse an der angeschlossenen Ausstellung zeigten die rund 120 Besucher der Hortonworks-Roadshow in München.
Reges Interesse an der angeschlossenen Ausstellung zeigten die rund 120 Besucher der Hortonworks-Roadshow in München. (Bild: Rüdiger)

120 Besucher kamen zur Hortonworks-Roadshow nach München – unter anderem, um Christopher Goth kennenzulernen, den neuen Verantwortlichen für die Region Deutschland, Österreich und die Schweiz.

Mit der Aufforderung: „Interagieren Sie – die Open Source Community lebt von der Interaktion ihrer Mitglieder!“ begrüßte Christopher Goth, frisch gebackener Regional Sales Director Central Europe, die etwa 120 Gäste der jährlichen Hortonworks-Roadshow in München. Hortonworks ist neben Cloudera die wichtigste Hadoop-Distribution und nach eigenen Angaben die einzige, die konsequent nach dem Open-Source-Prinzip ihren Kunden kostenlose Software plus Service und Beratung über Vertrag anbietet.

Christopher Goth, Regional Sales Director Central Europe, begrüßt die rund 120 Gäste von Hortonworks in München und fordert zu fleißigem Interagieren auf.
Christopher Goth, Regional Sales Director Central Europe, begrüßt die rund 120 Gäste von Hortonworks in München und fordert zu fleißigem Interagieren auf. (Bild: Rüdiger)

Hortonworks-Kunden kaufen jährliche Abos und bekommen unter anderem proaktiven Support mit einem Tool namens Smart Sense, das die Nutzungsmuster der Anwender analysiert und sie auf potenzielle Probleme hinweist, bevor sie auftreten. Die 20 Gründer von Hortonworks stammten aus Hadoop-Entwicklungsteams. Wenig verwunderlich, ist das Unternehmen in vielen Open-Source-Communities aktiv.

In seiner Keynote fasste John Kreisa, der in London stationierte Vice President Central Europe, die bekannten Trends der Datenwelt zusammen: rapides Datenwachstum, das neue Technologien fordert und fördert. Im Gespräch mit BigData-Insider machten sich leider die bei börsennotierten US-Firmen üblichen Schweigegelübde ungut bemerkbar: Außer der Tatsache, dass Hortonworks rund elf Prozent seines Umsatzes von rund 60 Millionen US-Dollar im gesamten Markt außerhalb der USA erwirtschaftet, ließ sich nichts Konkretes über die Dimensionen des europäischen oder deutschen Umsatzes in Erfahrung bringen. Gegenüber dem großen Konkurrenten Cloudera liegt Hortonworks rund 20 Marktanteils-Prozente zurück, gab Kreisa zu. „Wir haben aber auch erst 2011 und damit drei Jahre später angefangen“, fügt er hinzu.

Intelligente Fahrzeuge

Das intelligente Fahrzeug ist für Kreisa ein wichtiges Anwendungsfeld der neuen Datentechnologien, die stationäre und mobile Daten integrieren. Auch Johannes Horneck, Server Category Manager bei Hortonworks-Partner HPE, schilderte Mobilitätsanwendungen als Kernapplikationen und prognostizierte: „In Zukunft braucht man einen kleinen Hadoop-Server in jedem Fahrzeug, weil man sonst die anfallenden Daten nicht auswerten kann.“

John Kreisa, Vice President Central Europe, erklärt den Gästen das Zusammenspiel der unterschiedlichen Hortonworks-Produkte.
John Kreisa, Vice President Central Europe, erklärt den Gästen das Zusammenspiel der unterschiedlichen Hortonworks-Produkte. (Bild: Rüdiger)

Das mobile Datenverarbeitungsaggregat soll sich sogar stationäre Daten zusätzlich zu den im Fahrzeug in Echtzeit anfallenden Datenmassen hinzuholen können, um zu für den Fahrer oder die automatische Fahrzeugsteuerung relevanten Erkenntnissen zu kommen. HPE sitzt im Vorstand von Hortonworks und investierte in den vergangenen Jahren laut Server Category Manager Johannes Horneck 50 Millionen US-Dollar in den Hadoop-Spezialisten. Ein weiterer wichtiger Partner ist EMC/Dell.

Produkte für stationäre und mobile Daten

Für mobile Daten bietet Hortonworks die Lösung DataFlow an, die sicheres Echtzeit-Ingest auch von Streaming-Daten ermöglicht und auf Apache NiFi basiert. Die Daten werden über eine leicht verständliche grafische Oberfläche gemanagt. Skripting ist nicht erforderlich. Die Herkunft der Daten wird exakt festgehalten, Zugriffsrechte lassen sich feingranular verteilen und alle Zugriffe werden protokolliert.

Stationäre Daten werden mit der Hortonworks DataPlatform bearbeitet. Die vollständig auf Apache basierende Plattform wird ständig weiterentwickelt. Sie zielt unter anderem auf Integration mit anderen (offenen und proprietären) Technologien. Die Plattform zentralisiert das Datenmanagement mithilfe des Apache-Datenbetriebssystems Yarn. Es erlaubt unterschiedliche Verarbeitungsformen, einschließlich maschinellem Lernen, und besitzt integrierte Sicherheits- und Governance-Funktionen. Auf Yarn wird Spark als analytisches Tool betrieben. Für schnellen SQL-Datenzugriff sorgt in Apache Hive, das ebenfalls auf Yarn aufgelagert ist.

Dr. Bernhard Walter, Solution Engineer, gab einen Ausblick auf die Zukunft von Hadoop und Yarn. Schon bald sollen Web-Applikationen auf einem weiterentwickelten Yarn 3.0 laufen, also auf bestehenden Clustern. Werkzeuge wie Spark, Tomcat und andere können dann in einem Docker-Container mit Yarn verwaltet werden. HDFS soll in Zukunft flexibler werden, zum Beispiel besser mit vielen kleinen Dateien zurechtkommen. Aus Komponenten wie Kafka, Storm, Hbase, Solr, Hive und HDFS sollen fertig konfigurierte Anwendungsumgebungen entstehen, etwa für das Internet der Dinge, wobei mehrere unterschiedliche Versionen der Tools parallel arbeiten können. Zudem ist geplant, dass auf Ambari-Clustern weitere Ambari-Cluster laufen können, ohne dafür zusätzliche virtuelle Maschinen einrichten zu müssen. Das geht natürlich nur, wenn der bestehende Cluster mit seinen virtuellen Maschinen freie Verarbeitungskapazitäten hat.

Ein Büro für die DACH-Mitarbeiter

Im Interview mit BigData-Insider schilderte der Ex-Tibco-Mann und DACH-Chef Goth seine Pläne: Ab Anfang nächstes Jahr soll es ein Büro für die Mitarbeiter der Region DACH geben, voraussichtlich in München. Daneben will Goth das Bewusstsein des Marktes für die Möglichkeiten von Hadoop steigern. „Die Welle schwappt gerade erst über den Atlantik, in den nächsten drei Jahren wird sich ungeheuer viel tun“, ist er überzeugt. Gegenüber dem wichtigsten Konkurrenten, Cloudera, will Goth vor allem mit dem konsequent offenen Konzept von Hortonworks punkten. „Bei uns fließt über die vielen Committer wirklich alles, was wir entwickeln, sofort zurück an die Open Source Community“, beteuert er.

Viele Anwendungsbeispiele stammten aus dem Security-Umfeld: Kreisa berichtete vom Hortonworks-Nutzer Prescient, der für seine Kunden, sicherheitsbedürftige Reisende, 49.000 Datenquellen in Echtzeit auf sicherheitsrelevante Informationen auswertet und die sich daraus ergebenden Hinweise in eine App, den Prescient Traveler, einspeist. Durch Anwendung von Hortonworks als Grundlage der Datenauswertung konnte die Effizienz bei der Bereitstellung der Sicherheitsinformationen um 73 Prozent verbessert werden.

Kreditbetrugsermittlung in Echtzeit

Walter berichtete von einem Beispiel aus der Kreditbetrugsermittlung, das mittels komplexer Datenmodelle mit großen Datenarchiven, Echtzeit-Daten-Ingest, Kundenprofilen und integrierten Lernfähigkeiten arbeitet. Die Daten werden hier mit Apache NiFi aufgenommen, Kafka dient als verteiltes Queuing-System, Storm liest die Daten aus und normalisiert sie. Darauf wird ein analytisches Modell gelegt.

Letztlich entscheidet aber doch ein Mensch, nämlich der Datenanalyst, ab welchen Abweichungen Betrugsverdacht herrscht und gießt diese Einschätzung in eine später durch Lernen modifizierbare Regel. Ein Mensch entscheidet hier auch bei Verdachtsfällen, ob der Kunde tatsächlich gesperrt und in Echtzeit darüber benachrichtigt wird, um einen möglichen Irrtum umgehend aufzuklären. Tut er dies, wird die Regel, die auf dem Kunden-Normalverhalten basiert, sofort angepasst und der Kunde wieder freigeschaltet.

Dieter Knittel, bei T-Mobile Österreich für die Einführung von Big Data zuständig, berichtete über die inzwischen sechsjährige Erfahrung seines Unternehmens mit der Technologie. T-Mobile Austria hat 4,3 Millionen Kunden, macht 829 Millionen Euro Umsatz und hat 1.283 Angestellte in Österreich. Knittel betonte: „Unser Hauptanliegen ist bei der Big-Data-Nutzung der Datenschutz.“ Angewendet wird die Technologie heute vor allem für die interne Kundenanalyse, zum Beispiel der Umsatzentwicklung pro Kunde, für die Prozess- und Kundendienstoptimierung, etwa beim Umgang mit Reklamationen, und für Effizienzverbesserungen.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44302723 / Infrastruktur)