Definition Was ist Pentaho?

Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Hinter Pentaho verbirgt sich eine Sammlung verschiedener Programme für Business-Intelligence-Anwendungen. Die Software ist in einer Community-Version als Open Source Software oder in einer kostenpflichtigen Enterpriseversion verfügbar und für unterschiedliche Plattformen geeignet.

Anbieter zum Thema

(Bild: © aga7ta - stock.adobe.com)

Die Pentaho Corporation wurde 2004 gegründet und entwickelte eine Sammlung von Software für Anwendungen im Business-Intelligence-Umfeld. Die Basisversion der entstandenen Lösung ist als Open Source Software frei verfügbar und für verschiedene Plattformen geeignet. Zusätzlich existieren Enterprise-Versionen mit erweitertem Funktions- und Leistungsumfang, die kostenpflichtig sind.

Bereits 2007 zählte Pentaho zu den wichtigsten Open-Source-Projekten im Businessbereich. 2015 übernahm Hitachi Data Systems das Unternehmen Pentaho. Pentaho Hitachi Data Systems ist einer der weltweit führenden Anbieter für Open-Source-Business-Intelligence-Produkte. Die Software deckt die verschiedenen Bereiche der Business Intelligence ab. Dazu gehören das Reporting, die Datenanalyse, die Datenintegration und das Data-Mining sowie ETL-Werkzeuge (Extract, Transform, Load) zur Datenanpassung.

Aufgrund der guten Skalierbarkeit ist Pentaho für Big Data einsetzbar. Anwendungsbereiche ergeben sich in unterschiedlichsten Einsatzgebieten und umfassen zum Beispiel Auswertungen von Unternehmensdaten die Finanzen, Kundenbeziehungen oder das Marketing betreffend.

Die Möglichkeiten der Pentaho-BI-Plattform

Pentaho stellt eine zentrale Plattform für die Datenintegration, die Datenanalyse und die Datenvisualisierung bereit. Daten lassen sich extrahieren, bearbeiten, auswerten und visualisieren.

Hierfür kann Pentaho auf unterschiedlichste Datenquellen zugreifen und die Informationen in integrierter Form für Geschäftsanalysen bereitstellen. Dank einer auf offenen Standards basierenden Architektur lässt sich Pentaho elegant in vorhandene Infrastrukturen integrieren.

Die Daten sind flexibel visualisierbar und leicht in verschiedene Berichte zu fassen. Es stehen Dashboards und interaktive Analysemöglichkeiten zur Verfügung. Selbst große Datenmengen sind schnell prozessierbar. Hierfür existieren Anbindungen zu den führenden Hadoop-, NoSQL- und BI-Analysedatenbanken, mit denen sich auch nicht strukturiert vorliegende Daten performant verarbeiten und modellieren lassen.

Mögliche Anwendungsbereiche für Pentaho im Unternehmen

Für Unternehmen stellt Pentaho Lösungen für die verschiedensten Bereiche bereit. Aufgrund detaillierter Einblicke in die Unternehmensdaten und qualifizierten Auswertungen von wichtigen Kennzahlen lässt sich die Effizienz im Unternehmen optimieren und der Erfolg steigern. Die offene Struktur und der modulare Aufbau von Pentaho sorgen dafür, dass Unternehmen aller Größenordnungen die Business-Intelligence-Plattform einsetzen können. Die Software ist flexibel und deckt ein breites Anwendungsspektrum ab. Sie kann verwendet werden, um Prozessoptimierungen durchzuführen, Kosten zu reduzieren, die Kundenbindungen zu verbessern oder Wachstumsfelder zu identifizieren. Die umfangreichen Analysemöglichkeiten sorgen für eine hohe Transparenz der Unternehmensdaten und Kennzahlen aus allen Unternehmensbereichen.

Die verschiedenen Module und Komponenten von Pentaho

Pentaho lässt sich in verschiedene Module und Komponenten unterteilen. Die wichtigsten Module der Business Intelligence Software sind:

  • Die Business-Analyse-Plattform,
  • das Modul für die Datenintegration und
  • das Reporting- und Visualisierungsmodul.

Die Business-Analyse-Plattform verfolgt einen interaktiven Ansatz und ermöglicht es dem Anwender, große Datenmengen unterschiedlicher Art aufzubereiten, zu modellieren und auszuwerten. Sie nutzt offene Standards und ist auf unterschiedlicher Hardware mit verschiedenen Betriebssystemen lauffähig. Mithilfe der Komponenten für die Datenintegration stehen umfangreiche Möglichkeiten zur Verfügung, Daten zu extrahieren, zu transformieren und zu laden. Daten aus verschiedene Quellen bringt das Modul in das gewünschte Format und legt sie beispielsweise im Data Warehouse ab.

Die Reporting- und Visualisierungstools beinhalten Anwendungen zum Generieren von Reports und grafisch aufbereiteten Auswertungen. Die Ausgabemöglichkeiten sind vielfältig und umfassen Formate wie PDF, XML, CSV oder Excel. Über Dashboards sind die Analysen managementgerecht aufzubereiten. Die Module von Pentaho bestehen aus einzelnen Komponenten, die je nach Aufgabe und Typ auf einem Server oder einem Client zu betreiben sind. Die Kopplung der Module erfolgt über den Pentaho BI-Server. Das Modul zur Datenintegration beinhaltet zum Beispiel Client-Komponenten wie Spoon zur Erstellung von Jobs und Transformationen, das Kommandozeilenprogramm Kitchen zur Ausführung von Jobs, das Kommandozeilenprogramm Pan zur Ausführung von Transformationen oder den Carte-Server zur Ausführung von Jobs und Transformationen auf entfernten Rechnern.

Modularer Aufbau und offene Struktur

Durch den modularen Aufbau und die offene Struktur ist es möglich, einzelne Module separat zu nutzen oder sie in externe Anwendungen zu integrieren. So ist beispielsweise das Modul für die Datenintegration unabhängig von den anderen Modulen als ETL-System einsetzbar. Reporting- und Visualisierungstools können in eigene Java-Anwendungen integriert werden. Einzelne Module sind zudem leicht austauschbar und durch andere Software zu ersetzen. Daraus ergibt sich eine Vielzahl unterschiedlicher Lösungsansätze für ähnliche Anwendungen.

Neben diesen Modulen existiert ein eigener Pentaho-Marktplatz, über den Anwender zahlreiche Plug-ins und Erweiterungen beziehen können. Sie lassen sich herunterladen und direkt installieren. Die Plug-ins sind von der Pentaho Community entwickelt und erweitern den Funktionsumfang und die Möglichkeiten der Pentaho Software. Beispielsweise stehen Plug-ins für SAP-Systeme zur Verfügung.

Die verschiedenen Pentaho-Versionen

Die Pentaho-BI-Plattform ist in unterschiedlichen Versionen verfügbar. Die Open-Source-Variante, Community Edition genannt, ist frei erhältlich und wird von der Pentaho Community unterstützt. Die Freeware basiert auf Java und bietet einen großen Funktionsumfang. Darüber hinaus existiert eine kostenpflichtige Enterprise Edition, die zusätzliche Funktionen bereitstellt und professionell supportet wird. Die Enterprise Edition kann verschiedene Ausbaustufen besitzen. Die Pentaho BI-Plattform lässt sich mit kostenlosen oder kostenpflichtigen Erweiterungen oder Plug-ins ergänzen. Die offene Architektur gestattet zudem, die Integration eigener Softwareanwendungen.

(ID:44765072)