Datenbanken, Analyse- und Berichts-Tools im Überblick

Die besten Open Source Tools für Big Data

Seite: 2/2

Firmen zum Thema

Neben der Datenspeicherung für Big-Data-Plattformen spielen auch Entwicklungswerkzeuge und Lösungen für die Erstellung und Durchführung von Abfragen eine wesentliche Rolle im Big-Data-Bereich. Mit Cloudera Impala erhalten Unternehmen eine sogenannte Massively-Parallel-Processing-SQL-Abfrage-Engine, die mit Hadoop zusammenarbeitet. Mit dieser Open-Source-Lösung (unter Apache-Lizenz) lassen sich direkte Abfrage für HDFS (Hadoop Distributed File System) und HBase ausführen. Der klare Vorteil der Lösung ist die Möglichkeit, in Echtzeit Abfragen für Hadoop erstellen zu können. Der Vorteil der Lösung liegt in der deutlich höheren Geschwindigkeit im Vergleich zu MapReduce und Hive.

Lingual

In diesem Bereich spielt auch Lingual eine Rolle. Auch mit dieser Open-Source-Lösung entwickeln Unternehmen Analysen für Apache-Hadoop-Umgebungen. Vorteil von Lingual ist die Möglichkeit, BI-Tools mit Hadoop zu verbinden, damit BI-Umgebungen auch mit Big-Data-Analysen arbeiten können. Lingual verbindet die beiden Welten Data Warehouses und Big Data miteinander.

Entwickler sollten sich dazu auch Pattern und Cascading ansehen. Auch hierbei handelt es sich um Erweiterungen für Hadoop und Entwicklungswerkzeuge für Java und Hadoop.

Wer deutsche Software verwenden will, sollte sich Apache Flink ansehen. Hierbei handelt es sich um eine Open-Source-Anwendung zur Analyse von Big Data. Dieses System wurde von Studenten der TU Berlin entwickelt. Das Produkt wird auch innerhalb der TU Berlin und für Forschungsprojekte im Big-Data-Bereich eingesetzt.

Analyse- und Berichts-Werkzeuge

Geht es um Big Data, spielen natürlich auch Werkzeuge zur Analyse der Daten und der Berichtserstellung eine wichtige Rolle. Denn gerade in diesem Bereich erhalten Verantwortliche erst Ergebnisse auf Basis von Big Data.

JasperReports Server ist ein standalone Server, der Berichte zentral zur Verfügung stellen kann. Als Oberfläche stehen webbasierte Oberflächen, aber auch Apps für Smartphones und Tablets zur Verfügung. Berichte lassen sich über den Server automatisiert ausdrucken, aber auch als E-Mail versenden.

Pentaho Community Edition ist in diesem Bereich ebenfalls von Nutzen. Hier stehen ebenfalls verschiedene Tools für die Erstellung von Berichten, zur Analyse, aber auch zur Datenintegration zur Verfügung. Die Berichte lassen sich über ein Webinterface abrufen und anzeigen. Pentaho unterstützt auch die Verwendung von Benutzerrollen und -Rechten. Neben diesen beiden Werkzeugen, setzen viele Unternehmen auch noch auf Lumify.

Fazit

Open Source spielt im Unternehmen eine immer wichtige Rolle. Es gibt im Open-Source-Bereich nicht nur wertvolle und interessante Zusatz-Tools, sondern komplette Lösungen für kleine und große Unternehmen. Diese stehen im Funktionsumfang und den Möglichkeiten selten den kommerziellen Lösungen nach. Unternehmen sollten sich beim Einsatz von Big Data auch mit den hier vorgestellten Tools auseinandersetzen.

(ID:43004139)