Nachbericht zum 10. Pentaho Community Meeting

Mehr als nur eine BI-Plattform

| Autor / Redakteur: Stefan Müller / Nico Litzel

Rund 200 Teilnehmer aus 40 Ländern besuchten das 10. Pentaho Community Meeting.
Rund 200 Teilnehmer aus 40 Ländern besuchten das 10. Pentaho Community Meeting. (Bild: IT-Novum)

200 Teilnehmer aus 40 Ländern und 24 Referenten – das war das 10. Pentaho Community Meeting, das vom 10. bis 12. November in Mainz stattfand. Im Mittelpunkt der Jubiläumsveranstaltung stand die Vorstellung verschiedener Pentaho-Einsatzszenarien bei verschiedenen Organisationen und Unternehmen, darunter das CERN und Essent Belgien.

Das Pentaho Community Meeting ist das jährliche Treffen aller Anwender und Entwickler der Pentaho-Plattform. Im Fokus stehen der Erfahrungs- und Wissensaustausch zu den einzelnen Modulen für Datenintegration, Reporting, Analysen und Datenvisualisierungen. Das Community Meeting findet seit 2008 statt und verfügt über viele regionale Ableger, wie auch das deutsche Pentaho User Meeting. Zum zehnjährigen Bestehen fand die Veranstaltung dort statt, wo 2008 die Erstauflage des Events mit gerade einmal 38 Teilnehmern veranstaltet wurde: in den ehrwürdigen Kupferbergterrassen in Mainz. Organisator war der deutsche Pentaho-Partner IT-Novum.

Während sich Pentaho 2008 als Open-Source-Lösung für Datenintegration und -analyse erst noch etablieren musste, ist die Plattform zehn Jahre später arriviert und weltweit in Organisationen und Unternehmen im Einsatz, unter anderem bei der deutschen Bundespolizei. Pentaho ist die erste BI-Plattform, die quelloffene Werkzeuge für die Integration und Analyse von Big Data anbietet, weshalb sie vor zwei Jahren von Hitachi gekauft und vor kurzem in die Produktpalette des neu entstandenen Unternehmens Hitachi Vantara integriert wurde.

Pentaho wird Teil von Hitachi Vantara

Business Unit gegründet

Pentaho wird Teil von Hitachi Vantara

26.09.17 - Pentaho, Anbieter einer Big-Data-Integration- und Analytics-Software-Plattform, wurde vor zwei Jahren von Hitachi Data Systems (HDS) gekauft. Nun formt Hitachi aus Pentaho, HDS und der Hitachi Insight Group mit „Hitachi Vantara“ eine neue Geschäftseinheit. Der Schwerpunkt soll auf innovativen IT-, IoT- und OT-orientierten Analytiklösungen liegen lesen

Das Pentaho Community Meeting begann Freitagabend mit einem Hackaton, bei dem 20 Entwickler ihre Programmierfähigkeiten unter Beweis stellten. Technische Kurzvorträge schafften den fließen Übergang zum Konferenztag am Samstag. In 24 Vorträgen beschäftigten sich Anwender und Entwickler mit verschiedenen Aspekten der BI-Plattform, stellten unterschiedliche Anwendungsszenarien vor und gaben Einblick in ihre Datenprojekte.

CERN beschleunigt sein Business Computing mit Pentaho

Jan Janke
Jan Janke (Bild: IT-Novum)

Den spannendsten Beitrag des Pentaho Community Meetings lieferte Jan Janke vom CERN mit seiner Vorstellung des riesigen Pentaho-Projekts der Organisation. Die größte Forschungseinrichtung der Welt beschäftigt über 2.300 Angestellte, 1.600 Forscher und mehr als 12.000 Gastwissenschaftler, die riesige Datenmengen produzieren – eine große Herausforderung für die IT. Für den Umgang mit BI-, Reporting- und Analyseinfrastrukturen setzt das CERN Pentaho ein. Vor dem Hintergrund der sich rasch ändernden Rahmenbedingungen und Anforderungen schätzt das CERN insbesondere die Offenheit, Skalierbarkeit und Flexibilität der Plattform.

Verwendung finden alle Module der Plattform, von der Datenintegration über das Berichtswesen und Ad-hoc-Analysen bis hin zu Datenvisualisierungen. Analysen und Reports beruhen auf einem Data Warehouse, das fast in Realtime arbeitet. Die Frage nach den Datenintegrationsprozessen beantwortete Jan Janke mit dem lakonischen Hinweis, dass es zwar sehr viele gäbe, diese aber „einfach funktionieren müssen“.

Der Pentaho Analyzer wird in verschiedenen Abteilungen im CERN eingesetzt, die das Tool aufgrund seiner leichten Bedienbarkeit und Fähigkeit, schnelle Einsichten in Geschäftsprozesse auf Ad-hoc-Basis zu gewähren, schätzen. Dass die Software intuitiv bedienbar ist, hat aber auch Schattenseiten: Die Ansprüche der Benutzer sind sehr hoch, weshalb die CERN-Administratoren ständig daran arbeiten, die Performance zu verbessern.

Pentaho Report Designer löst Zollprobleme

Eine weitere Herausforderung besteht in der geografischen Lage des CERN in Frankreich und dem Nicht-EU-Mitgliedsstaat Schweiz. Die täglichen Probleme im Umgang mit den Zollbestimmungen löst das CERN mit dem Pentaho Report Designer, der die Generierung der zahlreichen Formulare ermöglicht. Daneben nutzt das CERN die offenen Schnittstellen der Plattform, um Pentaho in die internen Anwendungen zu integrieren und so den Mitarbeitern eine Vielzahl verschiedener Reporting-Self-Services zur Verfügung zu stellen. Auch für die Visualisierung von Daten kommt Pentaho flächendeckend zum Einsatz, unter anderem für die Erstellung von Dashboards und die Visualisierung von KPIs für verschiedene Managementebenen.

Als internationale Organisation verarbeitet das CERN viele sensible Informationen, die in normalen Unternehmen nicht anfallen, wie etwa aus der Sozialversicherung, Krankenversicherung, Kinderbetreuung und sogar medizinische Daten. Aus diesem Grund gibt es besonders hohe Datenschutzvorkehrungen, die sich mit Pentaho abdecken lassen.

Bessere Gesundheitsversorgung in Mosambik

Devan Manharlal
Devan Manharlal (Bild: IT-Novum)

Eigens aus Mosambik angereist war Devan Manharlal von der Nichtregierungsorganisation Jhpiego, die Gesundheitsprojekte in Entwicklungsländern fördert. Devan stellte die Pentaho-basierte Gesundheitsdatenbank von Mosambik vor, die gesundheitsbezogene Informationen aus verschiedenen Drittsystemen integriert. Das erlaubt, die Versorgung der Bevölkerung mit Krankenschwestern und anderem Pflegepersonal zu verbessern.

In Mosambik kümmern sich 7.800 Krankenschwestern und -pfleger um die 27 Millionen Einwohner. Zum Vergleich: Hierzulande kommen auf 84 Millionen Deutsche eine Million Pflegekräfte. Darum zählt die WHO den afrikanischen Staat zu den zehn Ländern, die am schlechtesten mit Gesundheitspersonal versorgt sind.

Diesen Zustand verursacht nicht nur die dünne Personaldecke in Mosambik. Vor allem die geografisch ungleichmäßige Verteilung der Pflegekräfte und die große Anzahl von nicht arbeitenden Krankenschwestern tun ihr Übriges. Das Gesundheitsministerium war aufgrund der schlechten Datenlage nicht in der Lage, die Pflegekräfte im Land gezielt zu verteilen und Maßnahmen zur Aktivierung des passiven Personalbestands zu ergreifen. Die entsprechenden Informationen waren zwar vorhanden, aber auf zahlreiche Systeme in verschiedenen Institutionen verteilt, die teilweise ihre Datenhoheit nicht aufgeben wollten.

Planung und Organisation von Pflegekräften

Deshalb wurde das National Human Resources for Health Information Systems (HRIS oder eSIP-Sáude) gegründet. Ziel des Systems war es, die bestehenden Informationen im Gesundheitsbereich aus den verteilten Datenquellen zu einer integrierten Datenbank zusammenzuführen, um eine bessere Planung und Organisation von Pflegekräften zu ermöglichen. Als Plattform kam Pentaho zum Einsatz, weil die Plattform offen ist, starke Datenintegrationsfunktionen besitzt und es in Mosambik Java-Entwickler gibt.

eSIP-Sáude hatte durchschlagenden Erfolg: Es schafft nicht nur Klarheit über die aktuelle Situation im Gesundheitswesen (unterversorgte und überversorgte Regionen und Einrichtungen), sondern erlaubt auch zum ersten Mal eine datengestützte Planung von Verbesserungsmaßnahmen der Versorgungssituation. Da Pentaho webbasiert arbeitet, ist es außerdem möglich, Gesundheitsämtern, Ministerien, Krankenhäusern und Krankenstationen Zugriff auf die Daten zu geben. Das war mit den vorherigen Silolösungen unmöglich.

Devan betonte, dass ein wichtiger Erfolgsfaktor die Schulung des Personals gewesen sei: Bei einer Tour durch das ganze Land wurden Multiplikatoren geschult, die wiederum die Anwender vor Ort mit der neuen Lösung vertraut machten. In die Schulungen hat man viel Geld und Zeit investiert und sogar ein Pentaho Community Meeting abgehalten, damit sich die Anwender gegenseitig austauschen und von ihren Problemen und Lösungen berichten konnten. Wichtig sei es laut Devan gewesen, die Daten in einem beliebten und weit verbreiteten Format (Excel) zur Verfügung zu stellen, sodass die Benutzer die neue Lösung schnell akzeptierten.

Für Schmunzeln sorgte Devans Bemerkung, dass er und seine Kollegen in ländlichen Regionen mit Internetproblemen die Dashboards ausgedruckt hätten, um den Umgang damit zu erklären. Tatsächlich nahmen danach die Nutzerzahlen in diesen Regionen signifikant zu.

Den anderen Anwendern gab Devan die folgenden Tipps mit auf den Weg:

  • Transparenz: Daten so offen wie möglich veröffentlichen und teilen
  • Endanwender an der Definition der Anforderungen beteiligen
  • Bei der Definition der Kennzahlen ist weniger mehr
  • Kontinuierliche Schulungen auf allen Ebenen
  • Klare Projektkommunikation
  • Feedback abfragen

SAP-Daten verfügbar machen: der Pentaho/SAP Connector

74 Prozent aller Transaktionen weltweit berühren ein SAP-System. Entsprechend gefragt sind SAP-Daten. An diese ist aber schwer zu kommen: Sie zu migrieren oder zu exportieren, ist fast unmöglich, weil SAP ein proprietäres Datenformat besitzt und weil die Lernkurve für Entwickler steil ist. Darum sind ABAP-Entwickler oft der Flaschenhals im Unternehmen.

Unternehmen greifen deshalb häufig zu behelfsmäßigen Lösungen, z. B. Excel oder selbst geschriebene Anwendungen, die sich jedoch meistens nicht in anderen Bereichen der Organisation einsetzen lassen. Erschwerend kommt hinzu, dass SAP-Entwickler für viele Unternehmen zu teuer bzw. eine knappe Ressource sind, die nur schwer ersetzbar ist.

Stefan Müller und Alexander Keidel von IT-Novum stellten einen Connector vor, mit dem sich Daten aus SAP nach Pentaho exportieren lassen, um sie dort weiterzuverarbeiten und zusammen mit Daten aus anderen Systemen für Analysen oder Berichte zu nutzen. Der Connector macht sich die offene Architektur von Pentaho zunutze, mit der sich nahezu alle Arten von Daten integrieren lassen. Er unterstützt die aktuelle Version von Pentaho Data Integration, Metadata Injection, Variablen, Filter, Feldauswahl, das Mapping von SAP- auf Java-Datentypen, das Lesen von SAP-Tabellen und BAPI-Abfragen. Integriert werden können Daten aus SAP ERP und SAP BW.

Integration von Umweltdaten mit Pentaho

Dass sich Pentaho auch für den Einsatz für semi- und unstrukturierte Daten eignet, stellt der Vortrag von Kamil Nešetřil von der Technischen Universität Liberec unter Beweis. Die Universität betreibt das Projekt dataearth.cz, ein Grundwasserinformationssystem. dataearth basiert auf Pentaho, es verwendet dessen Datenintegrations-, Berichts-, Analyse- und Dashboard-Funktionen.

Die Herausforderung liegt laut Kamil in der Integration der Daten aus verschiedenen Systemen, die im Bereich Grundwasser und Umwelt sowohl strukturiert als auch semistrukturiert und unstrukturiert vorliegen. Mit Pentaho ist es möglich, die verschiedenen Datentypen zu integrieren. So erhalten die Anwender einen übergreifenden Blick auf den Zustand des Grundwassers in verschiedenen Regionen und können Prognosen zu möglichen Entwicklungen aufstellen.

Migration von Microsoft auf Pentaho

Die Migration von Microsoft in eine quelloffene Lösung ist für viele Unternehmen eine große Herausforderung. Der Energieversorger Essent Belgium wagte den Schritt, indem er seine On-premise-Lösung mit Provision auf einen Cloud-basierten Ansatz mit Pentaho migrierte.

Für die Migration sprach neben größerer Skalierbarkeit, höherer Effizienz und niedrigeren Kosten vor allem die Starrheit des alten Systems, das den Standorten und externen Usergruppen (Zulieferer, Kunden) nicht zugänglich gemacht werden konnte. Die neue Cloud-basierte Lösung kombiniert Pentaho mit Amazon Web Services (AWS) und konnte deshalb einfach für die verschiedenen Unternehmens- und Anwendergruppen ausgerollt werden.

Bart Maertens
Bart Maertens (Bild: IT-Novum)

Das Projekt begann 2015 mit der Auswahl der Plattform, wobei Pentaho den Vorzug vor Jasper erhalten hat. Im vergangenen Jahr wurden das Unternehmensportal gebaut und die Migration durchgeführt. Im Februar dieses Jahres wurde die erste B2B-Plattform veröffentlicht, die B2C-Version soll Anfang 2018 folgen. Projektleiter Bart Maertens hob hervor, dass bei der Projektumsetzung sowohl ein traditionelles BI-Team mit Analysten und Entwickler der ETL-Prozesse, Reports und Dashboards beteiligt war, als auch ein reines Analyseteam mit Data Scientists und Softwareingenieuren.

Mit der Anfangs gewählten agilen Entwicklungsmethode machte das Team gute Erfahrungen, Bart betonte aber, dass der Ansatz konsequent anzuwenden sei. Als schwierig stellte es sich heraus, eine BI-Umgebung ohne Daten „auf dem Trockenen“ zu bauen und mithilfe von AWS umzusetzen. Doch Essent hat alle Herausforderungen erfolgreich gemeistert und die Lösung innerhalb pünktlich in Betrieb genommen.

Pentaho ohne Entwickler-Know-how betreiben

Wie man Pentaho ohne die Hilfe von Entwicklern einführt und betreibt, demonstrierte Balázs Bárány aus Wien. Der Data Scientist hat die Webplattform SCO2T umgesetzt, die hinter dem ersten Motorroller-Sharing-Service in Österreich steht. SCO2T basiert ausschließlich auf Open Source-Technologien, hauptsächlich auf Pentaho.

Zu Beginn des Projekts standen die üblichen Herausforderungen von Start-ups: wenig Personal und Kapital sowie mangelnde Erfahrung in der Führung eines Unternehmens. Dazu kamen komplexe regulatorische Rahmenbedingungen und das Fehlen von IT-Spezialisten wie Software-Entwicklern. Aus diesem Gründen entschloss sich Balázs, eine Software zu nutzen, die er bereits kannte: Pentaho.

Pentaho kommt bei SCO2T für fast alle Unternehmensbereiche zum Einsatz: Benutzeranmeldung, Berechnung von Fahrtlänge und -preis, Erstellung der Rechnung, Datenexporte für Buchhaltung und Bankkommunikation oder fahrzeugbezogene Aktionen wie die Ermittlung der Position des Motorrollers. Daneben werden auch Analysen zu Fahrten, Benutzern und KPIs erstellt und visualisiert, z.B. um auf einer Karte die Fahrzeuge neben den Nutzeranfragen anzeigen und entsprechend entscheiden zu können, in welchen Stadtvierteln mehr und in welchen Gegenden weniger Fahrzeuge platziert sein sollten.

Für Balázs sind die Vorteile von Pentaho:

  • Datenbezogene Prozesse lassen sich schnell erstellen
  • Dashboards und Webapplikationen (SCO2T App) können schnell aufgebaut werden (Standard-Open-Source-Technologien, die sich einfach erweitern lassen)
  • Mächtige Plattform, die mehr bietet als klassische BI-Szenarien
  • Aus der Sicht der SCO2T-Geschäftsführung sind die Vorteile von Pentaho:
  • Im Gegensatz zu anderen Plattformen lassen sich neue Features schnell umsetzen und Change Requests rasch integrieren
  • Einfache Handhabung und gute Benutzerinteraktion
  • Datenexporte und -visualisierungen sind einfach möglich

Eine Zusammenfassung aller Vorträge des Pentaho Community Meetings gibt es auf dem Blog von IT-Novum.

Das nächste deutsche Pentaho User Meeting findet am 6. März 2018 in Frankfurt am Main statt.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45026850 / Analytics)