Big Data 2014 und die Elefantenrunde für das Enterprise

Das Hadoop-Wer-Gewinnt: Hortonworks versus Cloudera

Seite: 2/5

Anbieter zum Thema

Hortonworks

Das rund 300 Mitarbeiter starke Unternehmen und Hersteller der gleichnamigen Hadoop-Distribution aus Palo Alto hat im Februar eine Strategie-Allianz mit Red Hat bekannt gegebenen, woran sich unschwer erkennen lässt, dass derzeit alle IT- und Open-Source-Schwergewichte in der einen oder anderen Weise massiv in Big Data investieren. Auch mit Microsoft gibt es seit 2011 eine Zusammenarbeit.

Hortonworks Integration mit der Außenwelt
Hortonworks Integration mit der Außenwelt
(Bild: Hortonworks)

In deren Rahmen setzen die Redmonder Hortonworks-Technik in ihrer eigenen Hadopp-Distribution für Windows Azure und Windows Server ein. Ebenfalls im Februar hat Hortonworks die Verfügbarkeit der Beta-Version seiner „Hortonworks Data Platform for Windows“ angekündigt, die unter anderem Fundament der in gleichem Monat angekündigten Preview-Version von Windows „Azure HDInsight“ist, das erstmals „Hadoop 2.2“ (YARN) in Azure verfügbar macht.

Auch die Zusammenarbeit mit Red Hat sieht vor, dass beiden Unternehmen ihre Produktlinien besser aufeinander abstimmen und gemeinsame Lösungen auf den Markt bringen. Beide Unternehmen haben im Februar das Beta-Programm des Hortonworks Data Platform (HDP) Plugins für Red Hat Storage angekündigt. Den aktuellen Stand der Zusammenarbeit haben beiden Unternehmen auf dem im vergangenen Monat über die Bühne gegangenen Red Hat Summit demonstriert.

Ergänzendes zum Thema
Schwachpunkte im Kern von Hadoop
  • Echtzeitfähigkeit: Das Core Hadoop-System ist prinzipiell nicht in der Lage, Daten in Echtzeit auszuwerten und die Integration eines der zahlreichen Third-Party-Tools ist aufwendig.
  • Backup: Das Core Hadoop-System bietet nur rudimentäre Backup- und Disaster-Recovery-Funktionen.
  • Sicherheit: Bis Hadoop 2 hatten Anwender, die sich erfolgreich an einem Hadoop-Cluster anmelden konnten, auch Zugang zu sämtlichen dort gespeicherten Daten. Eine Verbesserung steht aber mit dem von Intel initiierten Rhino ins Haus, das hardwareunterstützte Verschlüsselung und Zweifaktor-Authentisierung einschließlich Single-Sign-on für die einzelnen Hadoop-Ressourcen implementiert. Aber auch Hadoop pur bietet mit der Version 2 (YARN) und dem Apache Knox-Projekt inzwischen entsprechende Sicherheitserweiterungen.
  • Aufwendige Installation und Administration: Das manuelle Aufsetzen und Verwalten eines Hadoop-Cluster ist sehr komplex und eine der Haupt-Daseinsberechtigungen für Hadoop-Distributionen, die zum Teil (Cloudera) Web-basierte Administrationswerkzeuge bieten.
  • Darüber hinaus ist eine Migration auf Hadoop 2 (YARN) ein zwar mögliches, aber ebenfalls komplexes Unterfangen.

Hortonworks, als vollständig quelloffen erhältliches Framework orientiert sich zudem möglichst am Hadoop-Standard. Zudem fließen sämtliche von Hortonworks voran getriebenen Weiterentwicklungen unmittelbar in das Open-Source-Projekt der Apache Software Foundation ein. Laut Hortonworks` Vice President Coporate Strategy verstehe das Unternehmen seine Distribution primär als Ergänzung zur konventionellen Datenhaltung. Das mache es für Partnerunternehmen wie Microsoft und Red Hat relativ leicht, die „Hortonworks Data Platform“ (HDP) zu integrieren beziehungsweise als OEM-Produkt zu vermarkten.

Denn Hortonworks paketiert und versioniert im Wesentlichen den Hadoop-Core und die verschiedenen Tools aus dem Hadoop-Universum. Die Installation erfolgt bei Hortonworks im Gegensatz zu Cloudera vorwiegend manuell, ist aber sehr gut dokumentiert und eine Web-basierte Cluster-Vewaltung ist mit „Apache Ambari“ inzwischen ebenfalls möglich.

Features für die Echtzeitanalyse

Eine Echtzeitanalyse, wie in Cloudera bereits enthalten, können Hortonworks-Nutzer mit dem auf „Apache Lucene“ basierenden Projekt „Elasticsearch“ realisieren. Elasticsearch muss allerdings manuell parallel zu Hortonworks installiert werden und kann Daten aus CRM- und ERP-Systemen auswerten, sowie Click-Streams und Log-Informationen.

Prominente Hortonworks-Nutzer sind zum Beispiel XING, WD oder Bloomberg. Das Unternehmen Hortonworks ist zudem auch die treibende Kraft hinter dem Hadoop-2.0-Standard YARN. Auch wenn für Hortonworks selbst keine Lizenzgebühren zu bezahlen sind, verdient das Unternehmen sein Geld mit Support-Gebühren (Enterprise Hadoop) für Hadoop, die nach der Größe des Hadoop-Clusters gestaffelt sind.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Artikelfiles und Artikellinks

Link: Hortonworks

Link: Cloudera

Link: MapR

(ID:42695649)