Kostengünstiger De-facto-Standard für das Datensammeln und -auswerten Hadoop als Big-Data-Betriebssystem überzeugt Datenanalysten

Autor / Redakteur: Hans-Joachim Edert / Ulrike Ostler |

In der IT dreht sich momentan alles um große und heterogene Datenbestände. „Hadoop“ macht Furore bei Ingenieuren und Infrastruktur-Architekten. Und das aus gutem Grund – denn das Open-Source-Framework ist bestens geeignet für den Einsatz im Rahmen von Big Data Analytics, die Hadoop für Geschäftsanwendungen produktiv macht.

Anbieter zum Thema

Für viele Unternehmen ein smarte Kombination: Hadoop und In-Memory-Verarbeitung
Für viele Unternehmen ein smarte Kombination: Hadoop und In-Memory-Verarbeitung
(Bild: SAS Institute)

Hadoop ist heute als kostengünstige Lösung für die verteilte Speicherung und parallele Verarbeitung von sehr großen Mengen an semi- und unstrukturierten Daten ein integraler Bestandteil der Big-Data-Anwendungslandschaft. Die Vorteile liegen auf der Hand: Hadoop bietet einen De-facto-Standard, ist branchenübergreifend und kostengünstig nutzbar.

Somit gilt: Wer heute Big Data sagt, meint längst auch Hadoop; denn diese Plattform erfüllt die Voraussetzungen für eine Analyse riesiger Mengen an polystrukturierten Daten:

  • Parallel Processing: Das Distributed-Computing-Modell sorgt dafür, dass riesige Datenvolumen schnell verarbeitet werden können.
  • Skalierbarkeit: Die Systeme lassen sich ganz einfach durch Hinzufügen von Knoten erweitern, und das praktisch hardwareunabhängig.
  • Speicherflexibilität: Im Gegensatz zu herkömmlichen relationalen Datenbanken müssen Daten nicht aufbereitet werden, um sie zu speichern; auch unstrukturierte Daten werden problemlos gespeichert.

Die IT-Welt steht mit Hadoop vor dem nächsten Paradigmenwechsel: Kostengünstige Commodity Hardware, meist unter Linux betrieben, läuft teuren Spezial-Servern den Rang ab, zumal Hadoop nur geringe Anforderungen an die darunterliegende Plattform stellt. Für Unternehmen, die ihre Daten auswerten wollen, bedeutet dies auch eine Befreiung aus der Bindung an einen bestimmten Datenbankanbieter.

Hadoop ist „in“

Analysten sagen Hadoop eine blühende Zukunft voraus, IDC geht von einem Jahreswachstum von 60,2 Prozent auf 812,8 Millionen Dollar im Jahr 2016 aus. Der Erfolg von Hadoop zeigt sich nicht zuletzt auch in der Historie: Was Anfang des Jahrtausends zuerst in Google-Forschungspapieren für ein verteiltes Dateisystem und ein Cluster-taugliches Datenverarbeitungsverfahren skizziert wurde, wird heute als Apache-Projekt und von kommerziellen Distributionen (zum Beispiel Cloudera oder Hortonworks) vorangetrieben.

Und diese Distributionen bekommen die volle Aufmerksamkeit der großen Unternehmen: So hat Intel jüngst 740 Millionen Dollar für einen Anteil von 18 Prozent an Cloudera investiert, ein Börsengang steht in Aussicht.

(ID:42820062)