Echtzeitanalyse-Anwendungen in Hadoop Cloudera startet Open-Source-Projekt Kudu

Autor / Redakteur: Martin Hensel / Nico Litzel |

Das Beta-Release von Kudu, einem spaltenbasierten Speicher für Hadoop, ist ab sofort verfügbar. Cloudera will damit unter Hadoop schnellere Datenanalysen ermöglichen.

Anbieter zum Thema

Cloudera Kudu ist ab sofort als Beta-Version erhältlich.
Cloudera Kudu ist ab sofort als Beta-Version erhältlich.
(Bild: Cloudera)

Kudu ist neben den vorhandenen Hadoop-Speicheroptionen HDFS und Apache HBase das erste native Hadoop-Speichermodul, das sowohl wahlfreien Zugriff mit niedriger Latenz als auch Analysen mit hohem Durchsatz unterstützt. Auf diese Weise sollen sich Hadoop-Architekturen für die zunehmend vorkommenden Echtzeit-Anwendungsfälle deutlich vereinfachen lassen. Die öffentliche Beta-Version ist ab sofort unter der Apache-Open-Source-Lizenz verfügbar und wird künftig in den Inkubator der Apache Software Foundation übergehen.

Echtzeitanalysen auf einer Ebene

Kudu ergänzt die Kapazitäten von HDFS und HBase, indem es gleichzeitiges schnelles Einfügen und Aktualisieren sowie effiziente spaltenweise Scans bietet. Dadurch sind analytische Workloads in Echtzeit auf einer einzelnen Speicherebene möglich. Komplexe Architekturen werden überflüssig. Zudem vereinfacht Kudu das Erstellen von Analyseanwendungen, da häufige Anwendungsfälle wie Zeitreihenanalyse, Maschinendatenanalyse und Online-Reporting unterstützt werden. Das Konzept sieht außerdem vor, dass sich aktuelle Trends bei Hardware und speichergestützter Verarbeitung ausnutzen lassen.

Intel-Technik ausnutzen

Cloudera hat Kudu gemeinsam mit Intel entwickelt, wodurch Kudu heutige und künftige Intel-Prozessoren und –Speichertechnologien sowie Innovationen bei persistenten Speichern (pmem) vollständig ausnutzen kann. Unterstützung kam auch aus der Community, unter anderem vom Smartphone-Hersteller Xiaomi sowie AtScale, Splice Machine und Zoomdata. „Im Zeitalter maschinengenerierter Daten gibt es ein steigendes Bedürfnis, Daten in menschlicher Echtzeit zu analysieren. Das trifft auf ein breites Spektrum analytischer Anwendungsbereiche zu, von Monitoring und Business Intelligence bis zu Vorhersagemodellen und Empfehlungen“,erklärt Curt Monash, Vorstand von Monsah Research. „Kudu, Spark und der Rest des Hadoop-Stacks bilden einen vielversprechenden Ansatz, um letztlich diese Bedürfnisse zu decken“, ergänzt er.

(ID:43633446)