Kommentar von Dominik Claßen, Pentaho

Wie sich das Datenchaos bei Firmware Updates vermeiden lässt

| Autor / Redakteur: Dominik Claßen / Nico Litzel

Der Autor: Dominik Claßen ist Director of Sales Engineering EMEA & APAC bei Pentaho
Der Autor: Dominik Claßen ist Director of Sales Engineering EMEA & APAC bei Pentaho (Bild: Pentaho)

Spätestens seit den großen Hacker-Angriffen auf IoT-Geräte wie Internetrouter, Webcams oder Kühlschränke, ist jedem bewusst, dass auch noch so simple Dinge mit Firmware ausgestattet sind, die hin und wieder mal aktualisiert werden muss, etwa um Sicherheitslücken zu schließen oder neue Funktionen aufzuspielen. Letzteres hat zum Beispiel Autohersteller Tesla auf spektakuläre Weise gezeigt, indem das Unternehmen nur mit einem Softwareupdate (ohne dass der Kunde dafür in die Werkstatt musste) den bereits ausgelieferten Autos das autonome Fahren beigebracht hat.

Es muss nun nicht immer so spektakulär sein wie im Fall von Tesla, aber auch die Firmware für Sensoren oder andere Geräte, die in der Industrie 4.0 zum Einsatz kommen, wird regelmäßig aktualisiert. Und das kann große Folgen haben. Es ist eine Prämisse von IoT, dass man durch die Vernetzung der Geräte und durch die Auswertung der von ihnen generierten Daten, geschäftlichen Nutzen ziehen kann. In der Praxis bedeutet das, dass die von den Dingen generierten Daten in einen Data Lake oder ein Data Warehouse übertragen und während des Datenintegrationsprozesses aufbereitet, bereinigt und angereichert werden, bevor sie für die Analyse in ein Frontend geladen werden.

Intensive Datenvorbereitung bei IoT-Anwendungsfällen

Dieser Prozess der Datenvorbereitung ist bei vielen IoT-Anwendungsfällen besonders zeitintensiv. Das liegt zum einem am Datenvolumen. Für die vorausschauende Wartung, der klassische IoT-Anwendungsfall schlechthin, eines Zuges kommen zum Beispiel bis zu 3.000 Sensoren zum Einsatz, die regelmäßig Daten übertragen. Zum anderen liegt das am Datenformat. Nicht alle dieser 3.000 Sensoren sind gleich, viele übertragen die Daten in unterschiedlichen Formaten und unterschiedlichen Frequenzen. Will man diese Vielfalt nun integrieren, ist auch wenn man grafische Integrations-Tools nutzt, immer noch eine Menge Arbeit zu leisten. Typischerweise wird beim Erstellen von Transformationen über Metadatendefinitionen definiert, was wie ablaufen soll. Das multipliziert mit der Anzahl an Datenquellen ergibt schnell eine unüberschaubare Menge an Prozessen. Noch schlimmer wird es, wenn hierfür Tools der „Generation Null“, also Skripte oder Programmiersprachen genutzt werden.

Gehen wir davon aus, dass diese Herkulesarbeit bewältigt wurde, die Definitionen stehen und die Einspeisung der Daten aus den verschiedenen Quellen und in den verschiedenen Formaten funktioniert reibungslos. Doch dann steht das Firmware Update an und Struktur, Inhalt oder Frequenzen von mehreren Sensoren ändern sich. Gerade in komplexen Umgebungen kann eine kleine Änderung an einem Funktionsbaustein bereits massive Auswirkungen auf das Gesamtsystem haben, gerade wenn es um die Kommunikation untereinander geht. Ein Datenproblem, dass auch vor den IoT-Implementierungen nicht haltmacht. Als Folge der Änderungen müssen die Prozesse und ihre Metadaten im Nachgang manuell angepasst werden, damit es nicht zum Datenchaos kommt. Um dies zu vermeiden und gleichzeitig nicht zu viel Zeit oder Ressourcen aufwenden zu müssen, sollte die Definition und Verwaltung der Metadaten automatisiert werden.

Automatische Metadaten-Injektion als Lösung

Ein neuer Ansatz, der hier helfen kann, ist die automatische Metadaten-Injektion. Anstatt manuell für jede Datenquelle die Metadaten zu definieren, wird nur eine Schablone definiert, die in groben Zügen die Datenintegration vorgibt. Dadurch können mit nur einer Transformation diverse Datenquellen eingespeist werden. Es ist nicht mehr nötig, die Metadatenstruktur für alle Quellen separat zu definieren. Vielmehr werden die Metadaten während des Integrationsprozesses aus den Quelldaten ausgelesen und in die Schablone injiziert.

Diese automatische Erkennung und die Einspeisung in die Schablone während der Laufzeit beschleunigen den Einspeisungsprozess drastisch und lassen sich für tausende von Datenquellen skalieren. Quasi nebenbei ist damit auch die Last der Wartung zumindest deutlich erleichtert, da durch den Scan der Metadaten Änderungen in der Datenstruktur automatisch übernommen und auch neue Datenquellen schnell und einfach integriert werden können. Mit diesem Ansatz lassen sich typischerweise ca. 80 Prozent der Datenintegrationsprozesse nicht nur automatisieren, sondern sogar automatisiert erstellen und warten.

Wer einen solchen Ansatz für seinen IoT-Anwendungsfall nutzt, sollte trotzdem etwas Zeit und Gedanken für die Definition der gewünschten Funktionalitäten aufbringen. Denn je gezielter die Metadateneinspeisung für spezifische Anwendungsfälle definiert wird, desto weniger müssen Firmware Updates gefürchtet werden. Dann sollte es auch kein Problem mehr sein, aus der Auswertung der von den Geräten generierten Daten, geschäftlichen Nutzen zu ziehen.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 44545439 / Infrastruktur)