Business Intelligence und die Cloud

Data Analytics und BI mit Cloud-Ressourcen

| Autor / Redakteur: Dr. Jens Graupmann* / Florian Karlstetter

Data Analytics und Business Intelligence mit Cloud-Ressourcen? Es kommt auf das Anwendungsszenario an.
Data Analytics und Business Intelligence mit Cloud-Ressourcen? Es kommt auf das Anwendungsszenario an. (Bild: © Lagarto Film - stock.adobe.com)

Auf dem Weg zum datenbasierten Unternehmen wachsen die zu analysierenden Datenmengen kontinuierlich. Data Analytics und Business Intelligence (BI) werden zur geschäftskritischen Grundlage der Unternehmenssteuerung. Was bedeutet das für die IT-Infrastruktur? Sind solche ressourcen-intensiven High-End Anwendungen mit der Cloud-Strategie von Unternehmen überhaupt vereinbar?

Die Vorteile der Cloud sind hinlänglich bekannt: Flexibilität und Agilität bei der Hinzubuchung und Abschaltung von IT-Ressourcen, Kostentransparenz mit minutengenauer Abrechnung, wenn gewünscht und nicht zuletzt Maintenance- und Security-Services, zur Verfügung gestellt vom Cloud-Dienstleister. Doch für Datenanalyse-Systeme, die in Sekundenschnelle die Basis für geschäftskritische Entscheidungen zur Verfügung stehen sollen, sind andere Attribute weit wichtiger: Performance und Verfügbarkeit. Je mehr ein Unternehmen sich in die Richtung datenbasierter Geschäftstätigkeit entwickelt, um so mehr werden die Data-Analytics-Systeme dauerhaft unter Volllast laufen und damit dedizierte Ressourcen beanspruchen. Dann doch eher On-Premises?

Technischer Blickwinkel: Cloud und On-Premises im Performance-Vergleich

Um eine für BI und Data-Analytics optimierte IT- und Daten-Strategie im Unternehmen etablieren zu können, ist eine entsprechende IT-Infrastruktur samt Prozessen gefordert: Daten müssen erhoben und gespeichert, verschiedene Datenquellen integriert und nicht zuletzt BI und Data-Analytics-Systeme, bestehend aus leistungsfähigen Datenbanken und Analyse-Tools, aufgesetzt werden. Bis hierhin spielt es noch keine Rolle, ob all dem eine Public Cloud mit oder ohne Managed Services, ein Hosting-Modell oder On-Premises-Ressourcen zugrunde liegt.

Aber: Automatisierte und operative Data-Analytics-Systeme, die für betriebskritische Prozesse verantwortlich sind brauchen eine hohe, konsistente Performance. Virtualisierte Public Clouds schneiden hier im Vergleich schlechter ab – zum einen wegen des inhärenten Virtualisierungs-Overheads und zum anderen wegen des Prinzips der geteilten Ressourcen. Der sogenannte „Noisy Neighbour“, also ein anderer Kunde des Cloud-Providers, der „unsichtbar“ beispielsweise auf demselben Server rechnet und das gleiche Netzwerk nutzt, kann sich störend auswirken, vor allem dann, wenn die Systeme sowieso schon unter Spitzenlast laufen.

Und nicht nur das: Gerade wenn beispielsweise schnelle In-Memory-Datenbanken und massiv parallel verarbeitende Datenmanagement-Lösungen (MPP) zum Einsatz kommen, die die meiste Zeit unter Last sind, ist die flexible Zuteilung von Ressourcen in der Public Cloud nur bedingt hilfreich. Performance-Schwankungen in einzelnen Knoten wirken sich extrem auf die Gesamt-Performance aus und agiles Up- und Downscaling erfordert eine ständige Re-Organisation der Datenverarbeitung mit entsprechenden Performance-Einbrüchen. Hosting-Modelle mit dedizierten Ressourcen oder ein eigenes Rechenzentrum sind aus der Performance-Sicht geeigneter. Natürlich aber bieten Public Clouds auch dedizierte Ressourcen bis hin zu Bare-Metal-Instanzen, allerdings dann wiederum zu deutlich höheren Kosten.

Wirtschaftlicher Blickwinkel: die Kosten

Nichts schlägt die Flexibilität der Cloud: In wenigen Minuten lassen sich Ressourcen dazuschalten oder eben auch wieder freigeben, wenn sie nicht mehr benötigt werden. Hohe Anfangs-Investitionen in eigene Hardware entfallen, der Kunde zahlt nur, was er auch wirklich nutzt – und das minutengenau. Für viele Anwendungen ist das perfekt, für den nachmittäglichen Report zum Vortag, die Überbrückung von Spitzenlasten, oder auch nur für Projekte oder Evaluationen. Für geschäftskritische und operative Business Intelligence oder Data Analytics, z. B. als Basis von digitalen Geschäftsmodellen, ist allerdings auch hier eine differenziertere Betrachtung notwendig.

Gerade diese Flexibilität lassen sich die Cloud-Anbieter gut bezahlen. Je kürzer die Vertragslaufzeiten und die Abrechnungsintervalle, um so teurer wird der Service auf lange Sicht. Soll heißen: Eine Lösung zur Datenanalyse, die über die nächsten Jahre die Geschicke des Unternehmens unterstützen soll, kann oft auf diese hohe Flexibilität verzichten. Die günstigeren Angebote der Public-Cloud-Anbieter mit Laufzeiten von einem oder mehr Jahren verdienen es deshalb, in Betracht gezogen zu werden. Wenn ein Unternehmen jedoch bereit ist, sich für mehrere Jahre vertraglich zu binden, werden auch Hosting-Angebote und die eigene Anschaffung wieder interessant.

Hier gilt es, die verschiedenen Kosten zu kumulieren: So mögen zum Beispiel die Kosten für den laufenden Betrieb einer On-Premises-Infrastruktur geringer sein, die Hardware muss zuvor aber angeschafft werden. Und möglicherweise sind die Kosten für den Betrieb in einer Public Cloud schon nach einem Jahr insgesamt höher, jedoch stellt der Anbieter zusätzliche Services für die Maintenance der IT bereit, die ein Unternehmen bei Eigenbetrieb erstmal stemmen müsste.

Strategischer Blickwinkel: BI und Data Analytics in die Cloud-Strategie einpassen

Das Fazit: Es kommt auf den konkreten Use Case an. Das gilt nicht nur für technische und wirtschaftliche Aspekte. Denn auch die Einführung einer Data-Analytics- bzw. Business-Intelligence-Lösung kann nicht für sich allein, sondern muss im gesamten IT-Infrastruktur-Kontext betrachtet werden. So ist eine Entscheidung für Cloud Computing oft grundsätzlicher und strategischer Natur, weil die Vorteile insgesamt überwiegen. Möglicherweise kann die Cloud ihre Vorteile bei High-End Analytics nicht immer voll ausspielen, sie kann aber trotzdem aus zahlreichen anderen Gründen die geeignete Infrastruktur sein. Daraus ergibt sich eine Änderung des Blickwinkels auf die Bausteine der Lösung: BI-, Data-Analytics und Datenbank-Systeme sollten flexibel genug sein, um sich in die unter Umständen volatile Cloud-Strategie des Unternehmens einzupassen.

Idealerweise arbeitet die gewählte Datenbank samt Tools Infrastruktur-unabhängig und ist sowohl in der Cloud als auch On-Premises implementierbar. Cloud-ready bedeutet dabei natürlich insbesondere, mit den Marktführern wie Amazon Web Services (AWS) oder Microsoft Azure kompatibel zu sein. Diese Flexibilität bei der Auswahl der Plattform ist gleichzeitig die Garantie für Unternehmen, dass die gewählten Produkte zu keinem infrastrukturellen Vendor-Lockin führen, sondern bei Bedarf umgezogen werden können.

Um die Vorteile aller Infrastruktur-Konzepte zu nutzen, kann eine hybride Cloud-Strategie die richtige Wahl sein. Auch hier kommt es auf die übergeordnete Strategie des Unternehmens an, jedoch sollte bereits bei der Wahl der BI- und Datenbank-Lösung auf entsprechende Integrations- und Deployment-Möglichkeiten geachtet werden. Eine hybride Cloud ermöglicht es, alle Belange zwischen Performance, den Kosten und dem Wunsch nach lokaler Datenhaltung aus verschiedensten sicherheitstechnischen Gründen individuell auszutarieren. Zudem ist sie geeignet, um beispielsweise Schritt für Schritt in die Cloud zu migrieren. Um so wichtiger ist es, dass die gewählte Lösung jede Ausprägung flexibel unterstützt.

Dr. Jens Graupmann, VP Product Management Exasol.
Dr. Jens Graupmann, VP Product Management Exasol. (Bild: Exasol)

Der Autor: Dr. Jens Graupmann ist Vice President of Product Management der Exasol AG. Er ist Experte in den Bereichen Business Development, IT und Produktmanagement. Der am Max-Planck Institut promovierte Informatiker betreut bei Exasol die Fachgebiete Datenbanken und Datenmanagement, Business Intelligence und Datamining sowie Echtzeitanalysen und die Cloud.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45669425 / Infrastruktur)