Suchen

Die Enterprise-tauglichen Ausprägungen von Hadoop Barc veröffentlicht Vergleich von Hadoop-Distributionen

Redakteur: Ulrike Ostler

Forrester hat schon eine, jetzt auch das deutsche Forschungs- und Beratungsinstitut für Unternehmenssoftware Barc: eine vergleichende Studie der Hadoop-Distributionen. Damit sollen Unternehmen einen Überblick über die diversen auf Apache Hadoop basierenden, aber funktional oft unterschiedlichen Angebote für die Verwaltung von Big Data erhalten.

Firmen zum Thema

Barc bietet unter anderem eine Übersicht und Einordnung der Hadoop-Partnerschaften.
Barc bietet unter anderem eine Übersicht und Einordnung der Hadoop-Partnerschaften.
(Bild: Barc)

Der Wunsch nach einer geschäftlichen Nutzung von Big Data hat in den vergangenen Monaten auch die Nachfrage nach Techniken verstärkt, mit denen sich solche großen, polystrukturierten Datenbestände verwalten sowie schnell und fortschrittlich auswerten lassen. Einer der größten Hoffnungsträger ist hierbei „Hadoop“, eine Sammlung von Komponenten für unterschiedliche Aufgabenstellungen für die Verwaltung und den Zugriff auf strukturierte und unstrukturierte Daten.

Hadoop ist ein seit 2008 bei der Apache Software Foundation angesiedeltes Top-Level-Projekt, das sich aufgrund des großen Interesses von Anwenderunternehmen rasant weiterentwickelt. Arbeitsschwerpunkte sind aktuell die Performance, die Stabilität, Sicherheitsmechanismen sowie die Analysefähigkeit, Nutzbarkeit, Wartbarkeit und die Administrierbarkeit des komplexen Frameworks.

Das Versprechen kommerzieller Software-Anbieter ist es somit, die Community-getriebene Open-Source-Apache-Hadoop-Distribution auch für die Ansprüche von Großunternehmen nutzbar zu machen. Begleitend ist hierfür ein verlässlicher Support anzubieten und Fragen der Haftung zu klären.

Vielfalt der Hadoop-Distributionen

Aufbauend auf dem Apache-Projekt versuchen diverse Anbieter mit ihren eigenständigen Hadoop-Distributionen Schwächen zu beseitigen, Lücken zu füllen und durch einen „Added Value“ im Markt zu punkten. So konkurrieren aktuell reine Hadoop-Distributionen (Cloudera, Hortonworks, MapR), Software-Stack-Anbieter (IBM), Speicherlösungsanbieter mit Hadoop-Angebot (Netapp, Pivotal) und Cloud-Service-Anbieter (Amazon, Microsoft, Rackspace) um die Gunst der Kunden.

Entsprechend unübersichtlich ist mittlerweile das Hadoop-Angebot für Unternehmen geworden. Die Marktübersicht „Hadoop-Distributionen im Vergleich“ des Business Application Research Center (Barc) kostet 490 Euro und soll für Aufklärung sorgen. Nach einer kurzen Einführung zu Hadoop und seinen Komponenten stellt die Untersuchung die fünf eigenständigen kommerziellen Hadoop-Distributionen Cloudera, Hortonworks, IBM, MapR und Pivotal gegenüber und gibt dem Leser dabei Auswahlkriterien für deren Bewertung an die Hand.

Gemeinsamkeiten und Unterschiede

Allen Distributionen gemein ist laut Studie, dass ihre Entwickler angesichts der hohen Anzahl von Komponenten und Werkzeuge, die in Hadoop-Umgebungen für die Integration, Speicherung, Zugriff, Analyse und das Reporting zum Einsatz kommen, das Daten-Management durch eine einheitliche Administrationskomponente vereinfachen wollen. Dabei zeigen sich in der Praxis vor allem in diesem Bereich Unterschiede zwischen den Angeboten, aber auch in den Feldern Security, Analytics und Benutzerfreundlichkeit.

Gute Karten sehen die Analysten offenbar für Hortonworks , Claudera und MapR. So kommentiert Timm Grosser, Co-Autor und Senior Analyst bei Barc, die weitere Marktentwicklung wie folgt: „In dem Maße, wie in den kommenden Monaten solche Daten-Management-Funktionen in Open-Source-Distributionen wie „Hortonworks“ verfügbar werden, wird sich der bislang noch teuer bezahlte „Added Value“ anderer Distributionen nicht mehr rechtfertigen lassen.“

(ID:42689511)