Kommentar von Dominik Classen, Pentaho

So kombiniert man das Internet der Dinge und BI

| Autor / Redakteur: Dominik Classen / Nico Litzel

Der Autor: Dominik Classen ist Director of Sales Engineering EMEA & APAC bei Pentaho
Der Autor: Dominik Classen ist Director of Sales Engineering EMEA & APAC bei Pentaho (Bild: Pentaho)

Das digitale Universum breitet sich rasant aus und gerade Maschinendaten spielen hier eine entscheidende Rolle. Das Analystenhaus IDC geht davon aus, dass bis 2025 etwa 40 Prozent des digitalen Universums von Maschinendaten und -schnittstellen generiert werden. Kein Wunder, dass das Internet der Dinge (IoT) eines der zentralen IT-Themen des Jahres ist und immer mehr Unternehmen darauf hoffen, von IoT und den Erkenntnissen aus IoT-Analysen zu profitieren.

Wie schon zuvor bei Big Data wird auch bei der IoT-Analyse die eigentliche Wertschöpfung für Anwender durch Data Blending entstehen, also dem Verknüpfen von IoT-Daten mit traditionellen Datenquellen. Der Grund dafür ist, dass Daten an sich wenig Mehrwert bieten, sondern sich dieser erst aus dem Kontext erschließt. Erst der Kontext verwandelt Daten in Informationen. Zum Beispiel sind die Sensordaten einer geöffneten Zugtür für sich allein nicht aussagekräftig. Erst aus dem Kontext „der Zug ist in Bewegung“ oder „die Tür hätte vor 20 Sekunden schließen müssen“ können wir ableiten, was die offene Zugtür bedeutet.

Unterschiedliche Datengeschwindigkeiten

Um diesen Kontext herzustellen, müssen IoT-Daten, die oft neue Strukturen aufweisen und in neuen Datenspeichern (meist Big Data) gehalten werden, mit den Daten von Unternehmenssoftware, die im traditionellen Data Warehouse gespeichert werden, miteinander verknüpft werden. Dazu bedarf es einer neuen Informationsarchitektur, die dabei auch den unterschiedlichen Datengeschwindigkeiten Rechnung trägt.

Während zum Beispiel ein Außentemperatursensor mit Messungen im Sekundentakt keinen Mehrwert gegenüber einer Messung alle 15 Minuten liefert, wird ein Lokführer in einer sekündlich aktualisierten Geschwindigkeitsanzeige dagegen einen deutlichen Mehrwert sehen. Der Trick ist nun, den letzten Zustand bzw. Temperaturwert von vor 15 Minuten mit der in dieser Sekunde anliegenden Geschwindigkeit zu korrelieren, um beispielsweise einen Bremsweg (längerer Bremsweg bei Hitze) oder aktuellen Energieverbrauch (Klimaanlage: Fahrtwind vs. stehender Zug) abzuleiten. Basierend auf diesen Informationen ist dann wieder der Termin der letzten Wartung interessant, der bei der gemessenen Belastung den nächsten Wartungstermin bestimmt.

Neue Datenarchitekturen

In diesem Zusammenhang werden neue Datenarchitekturen wie Lambda oder Zeta interessant. Allerdings führen diese dazu, dass unsere herkömmliche Vorstellung vom Information Management noch weiter abstrahiert werden muss. Der Ansatz, nachdem der Datenanalyst zur Lösung eines spezifischen Problems auf Daten direkt zugreift, galt zwar bisher als gängig, doch Informatiker wissen, dass dieser Vorgang nie wirklich so einfach war.

Die Datenbank ist eben doch nicht ein Behälter, in den die Daten einfach eingeworfen und später abgerufen werden können. Vielmehr existieren komplexe Helferfunktionen und Indizes, die nebeneinander ablaufen, um uns die Illusion zu geben, dass Daten einfach in einer Tabelle auf der Festplatte gespeichert werden, um mit einem „SELECT * FROM TABLE“ ausgeführt zu werden.

Die Unveränderbarkeit der Daten und die Herausforderung der Vielfalt

Um die Unveränderbarkeit der Daten und die (z. B. ACID-konformen) Transaktionen zu meistern, bedarf es neuer Architekturen, die den Endnutzern die gleiche Illusion des direkten Datenzugriffs verschaffen. Dabei stellt die Vielfalt (Variety) der IoT-Datentypen eine große Herausforderung dar. Datenmenge (Volumen) und Datengeschwindigkeit (Velocity) lassen sich durch horizontale und vertikale Skalierbarkeit in den Griff bekommen, während der Umgang mit der Datenvielfalt neuer adaptiver Datenintegrationstechniken bedarf, die die Datenermittlung automatisch ausführen, Informationen abrufen, aussagekräftige Zusammenhänge suchen und dann die Daten wirkungsvoll darstellen. Oder eben nicht die Daten darstellen, sondern gleich entsprechend der Datenlage handeln.

Klassische BI-Architekturen sind für die Herausforderungen geeignet, für die sie einst konzipiert wurden – meist Batchprozesse, die Einblicke darüber geben, was in der Vergangenheit passiert ist, in einer Welt mit konsistenten KPIs und unveränderlichen logischen Modellen des Geschäftsbetriebs.

IoT- und Big-Data-Technologien hingegen sollen die nebulösen Herausforderungen um Datenmenge, -geschwindigkeit und -vielfalt managen. Dabei kommen Techniken zum Einsatz, die vielmehr für probabilistische Szenarien geeignet sind und Maschinelles Lernen anwenden. Es ist eher unwahrscheinlich, dass Big-Data-Systeme implementiert werden, um zum Beispiel ein 100 Prozent aktuelles und akkurates Bild des Kontostandes in Echtzeit zu geben (Big-Data-Systeme sind oft, was man als „eventual consistency“ bezeichnet).

Welches Problem gilt es zu lösen?

Obwohl Data Blending eine Schlüsselrolle bei der Kombination von IoT mit klassischen BI-Technologien und Architekturen spielt, sollte die Auswahl der richtigen Architektur mit der Frage beginnen, welche Probleme eigentlich zu lösen sind. Will man erkunden und experimentieren, um das Geschäft besser zu verstehen, oder sucht man nach vorhandenen Fehlern?

Solche Fragen sind grundlegend, um zu determinieren, wie die neue Architektur aussehen soll. Im letzteren Fall sind vernetzte Architekturen eventuell wichtiger. Wie auch immer die Lösung aussieht, in beiden Fällen ist eine starke Datenintegrationsplattform, die nicht zwischen den beiden Architekturarten unterscheidet, wesentlich.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 44037098 / Infrastruktur)