Hadoop Summit 2015 Hortonworks wächst stark
„Adoption is the only option“ – die Einführung (von Hadoop) ist die einzige Option. Mit diesen Worten unterstrich Mike Gualteri, Principal Analyst beim Marktforschungsinstitut Forrester, auf dem Hadoop Summit 2015 die wachsende Rolle von Hadoop für Unternehmen.
Anbieter zum Thema

Das wachsende Interesse am Big Data Framework spiegelt sich in den Besucherzahlen wider: Über 1.000 Interessenten fanden im April ihren Weg nach Brüssel, wo in diesem Jahr – erstmals nach Amsterdam in den Vorjahren – die europäische Ausgabe des Hadoop Summits stattfand.
Das wachsende Interesse an Hadoop schlägt sich auch in den Geschäftszahlen von Hortonworks nieder, zusammen mit Yahoo Gastgeber des Summits: Das gerade einmal 2011 gegründete Unternehmen verzeichnete vom vierten Quartal 2013 bis zum vierten Quartal 2014 einen Kundenzuwachs von 249 Prozent (aktuellere Zahlen sollen bald folgen). Im gleichen Zeitraum ist es der Yahoo-Ausgründung gelungen, die Umsätze mit der auf Hadoop basierenden Plattform „Hortonworks Data Plattform“ (HDP) um 148 Prozent zu steigern. 15 bis 20 Prozent des Umsatzes generiert Hortonworks mittlerweile in Europa.
„Hadoop Everywhere“ mit SequenceIQ
Hortonworks nutzte den Summit für eine Reihe von Ankündigungen, etwa die Absicht, SequenceIQ übernehmen zu wollen. Das im Februar 2014 gegründete ungarische Unternehmen hat Techniken entwickelt, mit denen Unternehmen leicht bei Bedarf Hadoop-Cluster in der Cloud und in Docker-kompatiblen Umgebungen betreiben können, darunter Microsoft Azure, Amazon Web Services, Google Cloud Platform und OpenStack.
Eine der Techniken ist „Cloudbreak“, ein Infrastruktur-unabhängiges Hadoop-as-a-Service-API für multimandantenfähige Cluster. Daneben hat SequenceIQ „Periscope“ entwickelt, eine Lösung, die Hadoop um eine richtlinienbasierte automatische Skalierung bereichert und die sicherstellt, dass Service Level Agreements eingehalten werden können.
Die Übernahme von SequenceIQ soll noch in diesem Quartal abgeschlossen werden. Hortonworks will aber „unverzüglich“ mit der Integration von Cloudbreak und Periscope in HDP loslegen und beide Funktionen Kunden der Enterprise-Plus-Edition der Hortonworks Data Platfom anbieten.
ODP soll Verbreitung fördern
In Brüssel haben Hortonworks, IBM und die EMC-Tochter Pivotal rund 60 Tage nach der Ankündigung der „Open-Data-Platform“-Initiative (ODP) bekannt gegeben, dass ihre jeweiligen, auf Hadoop basierenden Plattformprodukte jetzt auf einem gemeinsamen ODP-Kern von Apache Hadoop 2.6 (inklusive HDFS, YARN und MapReduce) sowie auf Apache Ambari 2.0 basieren. Die Harmonisierung von Hortonworks Data Platfom 2.2, IBM Open Platform 4.0 mit Apache Hadoop und Pivotal HD 3.0 soll Kompatibilitätsprobleme verringern und Unternehmenskunden das Testen und Validieren erleichtern.
Dazu Shaun Connolly, Vice President of Corporate Strategy bei Hortonworks: „Wir bei Hortonworks sind davon überzeugt, dass Innovationen nicht isoliert entstehen, sondern durch Zusammenarbeit. Die Harmonisierung um einen gemeinsamen Kern von Apache Hadoop herum verringert die Komplexität und dient zum Aufbau von Interoperabilität im gesamten Hadoop-Ökosystem. Wir freuen uns, dass die ODP in weniger als 60 Tagen nach ihrer Gründung die Standardisierung zwischen den Plattformen von Hortonworks, IBM und Pivotal in der Industrie voranbringt. Indem wir den Einsatz von Apache Hadoop verbessern, beschleunigen wir den Innovationsprozess und letztendlich auch das Wachstum dieses Marktes.“
Weitere Mitglieder der jungen Brancheninitiative sind GE, Infosys, SAS, Attiscale, Capgemini, CenturyLink, EMC, PLDT, Splunk, Teradata, Verizon, VMware sowie WANdisco. Sowohl Cloudera als auch MapR fehlen und derzeit sieht es nicht so aus, als ob sich die Unternehmen der ODP-Initiative anschließen wollen.
Umfangreiche Verbesserungen bei HDP
Auf dem Summit hat Hortonworks eine Reihe von Verbesserungen und Weiterentwicklungen rund um die Hortonworks Data Platform vorgestellt. Kernstück der Neuerungen in Version 2.2 ist das Provisioning- und Management-Tool für Hadoop-Cluster „Ambari“, das kürzlich in Version 2.0 erschienen ist.
Ambari 2.0 bietet rollierende Upgrades: Administratoren können Downtimes verringern, indem sie ihre Hadoop Cluster automatisiert mithilfe von Ambari oder bereits im Unternehmen vorhandenen Standard-Scripting-Tools aktualisieren. Darüber hinaus profitieren Anwender jetzt von einer zentralisierten Verwaltung von Alarmen und Metriken.
Auch bei der Sicherheit bietet HDP 2.0 eine Reihe von wesentlichen Verbesserungen: So enthält die jüngste Version ein einfacheres Authentifizierung-Setup, das auf Kerberos zurückgreift und sich mit wenigen Klicks konfigurieren lässt. Zugleich laufen Installation und Konfiguration von Apache Ranger, dem Sicherheitsmanagement-Tool für Hadoop, jetzt vollautomatisch ab, sodass es für Administratoren ein Leichtes ist, Sicherheitsrichtlinien zentral zu verwalten.
Apache Spark
Die HDP 2.2 enthält jetzt auch Apache Spark in der stabilen Version 1.2.1 und bietet damit Spark-Anwendungsentwicklern eine Plattform für die lokale Entwicklung oder für Spark-Anwendungen in der Cloud.
Trusted Governance
Auf dem Brüsseler Summit wurden Neuigkeiten rund um die Data Governance Initiative (DGI) bekannt: Die Initiative hat Zuwachs bekommen – Entwickler von JPMorgan Chase und von Schlumberger haben sich der Initiative angeschlossen und arbeiten nun mit Entwicklern von Hortonworks, Aetna, Merck, Target und SAS zusammen, um die Anforderungen von Großunternehmen an eine umfassende Data Governance innerhalb der Apache Open Source Community voranzubringen.
Im Bereich Data Governance wurde der Apache Software Foundation in diesem Zusammenhang ein neues Projekt vorgeschlagen – „Apache Atlas“. Dieses zielt darauf ab, Datenklassifizierung, ein zentralisiertes Prüfungswesen, Suchfunktionen und Informationen zur Datenherkunft in Kombination mit einer Sicherheits- und Richtlinien-Engine bereitzustellen.
(ID:43346768)