Suchen

Kommentar von Christian Lutz, Crate.io Warum benötigen IIoT-Projekte IIoT-spezifische Datenbanken?

| Autor / Redakteur: Christian Lutz / Nico Litzel

Unzählige Möglichkeiten zur Steigerung der Produktionseffizienz sind ein Merkmal der Industrie 4.0: Von der Predictive Maintenance bis hin zu vernetzten Lieferketten, Computer Vision und Automated Guided Vehicles gibt es eine Vielzahl an Beispielen. Die genannten Anwendungsfälle haben hierbei eines gemeinsam: Sie alle erfordern die Erfassung, Verarbeitung, Speicherung und Analyse riesiger Datenmengen, um die datengesteuerte Entscheidungsfindung voranzutreiben.

Firma zum Thema

Der Autor: Christian Lutz ist CEO und Co-Founder von Crate.io
Der Autor: Christian Lutz ist CEO und Co-Founder von Crate.io
(Bild: Crate.io)

Eine entscheidende Rolle im IIoT nimmt Datenverarbeitung ein. Sie ermöglicht den Unternehmen, aus den Daten effizient skalierbare und performante Werte zu gewinnen. Doch obwohl die Datenbanktechnologie damit das Herzstück der digitalen Transformation ist, scheitern derzeit mehr als 70 Prozent der IoT-Projekte. Die Hauptgründe: der Mangel der erforderlichen Fähigkeiten und die technischen Herausforderungen bei der Implementierung effektiver Infrastrukturen. Denn längst nicht jedes System ist geeignet, einen möglichst zeitgemäßen und zugleich zukunftsgerichteten Übergang weg von den von traditionellen Infrastrukturen zu gewährleisten.

Doch warum stellen Daten aus dem Industriesektor eine solche Herausforderung dar?

Um die Frage des „Warum“ genau beantworten zu können, reicht fast schon ein Blick auf die Dimensionen dieser Daten. Denn ihr Umfang, aber auch ihre Form, unterscheidet sich stark von denen der Legacy- und Web-Scale-Daten. Die Größenordnung von Maschinendaten im IIoT-Maßstab ist gleichermaßen logisch wie auch schwer erfassbar. Man stelle sich eine Fabrik mit mehreren tausend Sensoren vor, die aktiv Daten von zehntausenden verschiedenen Sensortypen sammeln. Hier endet die Reihe aber noch nicht, denn selten ist nur von einer Fabrik die Rede – im Gegenteil: Stellen Sie sich eine Organisation vor, die 100 solcher Fabriken auf der ganzen Welt betreibt. Das sind dann sehr schnell sehr viele Daten. Doch die IIoT-Datenbankimplementierung muss diese nicht nur irgendwie sammeln, sondern auch eine Echtzeit-Datenanalyse ermöglichen, damit diese Daten ausgewertet, auf etwaige Fehler reagiert und zugleich Optimierungen für zukünftige Szenarien vermerkt werden können.

Leider beantwortet das allein noch nicht das Warum. Das andere Problem ist die Vielfalt der IIoT-Daten. IIoT-Sensordaten werden normalerweise als verschachteltes JSON-Dokument gespeichert. Es gibt auch relationale Daten wie Artikel- und Produktinformationen, Chargeninformationen, Topologie, Firmware usw., die alle mit Sensordaten korreliert und kontextualisiert werden, damit diese eine exakte und nutzbare Auswertung und Weiterverarbeitung erlauben. Darüber hinaus generiert das IIoT Volltext-Zeitreihendaten mit Zeitstempeln für die Verfolgung von Prozessen, georäumliche Daten mit den Koordinatendatenpunkten von sich bewegenden Geräten, Bilddaten, die zur Überprüfung des Produktzustands verwendet werden, und andere Multimedia-BLOB-Daten.

Da kommt also einiges zusammen und diese Dimension ist nicht etwa ein Sonderfall, sondern eher die sekündliche Normalität. Daher sollte eine Datenbank dazu in der Lage sein, eine solche Datenmenge ebenfalls als Normalität behandeln zu können, da es unter Umständen auch hier eher zu Steigerungen in der Zukunft kommt.

Und daher bieten sich herkömmliche Datenbanken nicht an

Wer versucht, diese traditionellen Datenbanken anzuwenden, bemerkt schnell deren Unzulänglichkeiten: Da die traditionellen Datenbanken mit ihren Legacy-Architekturen nicht für IIoT-Anwendungsfälle optimiert sind, gibt es diverse Unzulänglichkeiten. Zum einen sind herkömmliche SQL-Datenbanken wie Oracle und MySQL teuer in der Skalierung und nicht auf das hohe Datenvolumen und die Abfragekomplexität vorbereitet, die mit IIoT-Anwendungsfällen einhergehen. Gleichzeitig sind traditionelle NoSQL- und NewSQL-Datenbanken wie MongoDB und Apache Cassandra aus der Entwicklungsperspektive einladend, weil sie einfach zu bedienen sind. Da sie jedoch sowohl eine komplexe Verwaltung als auch spezialisierte Fachkräfte erfordern, verursachen sie enorm hohe Personal- und Verwaltungskosten. Und dabei erfüllen diese Datenbankoptionen weder die IIoT-Leistungsanforderungen, noch sind sie als NoSQL- und NewSQL-Lösung gut in SQL-gebundene Industrial Engineering Stacks integrierbar.

Ein weiteres Problem ist die verteilte Architektur. Oder besser: das Fehlen eben dieser. Zeitreihendatenbanken, wie beispielsweise InfluxDB und Timescale, weisen keine vollständig verteilten Architekturen auf. Joins, Subselects und Aggregationsabfragen werden nicht vollständig verteilt implementiert, was es erschwert, die Rechenleistung horizontal zu skalieren, um diesen Anforderungen gerecht zu werden. Mit anderen Worten, sind sie nicht für die Ausführung hochgradig gleichzeitiger Arbeitslasten ausgelegt. Dabei ist das sogar logisch, denn viele Zeitreihendatenbanken wurden speziell für das klassische IoT entwickelt, nicht für das schiere Ausmaß des industriellen IoT, das typischerweise um Größenordnungen größer und komplexer ist als andere Zeitreihen-Arbeitslasten, wie sie z. B. bei der Überwachung von IT-Systemen auftreten.

Die logische Konsequenz

Das IIoT erfordert unbegrenzte Skalierbarkeit. IIoT-Lösungen reichen leicht bis in den Terabyte-Bereich und können sogar Petabytes an Daten nutzen. Eine Datenbank muss nicht nur dieses Volumen bewältigen, sondern auch die Leistungsanforderungen auf der Rechenseite erfüllen – Stichwort Dynamik und Skalierbarkeit. Die Datenbank benötigt ein vielseitiges Datenmodell, das in der Lage ist, all die verschiedenen Arten von Daten zu speichern, die das IIoT erfordert. Die CrateDB ist hierbei eine interessante Alternative für „IIoT at scale“. Der Datenbank gelingt es mühelos, die oft in Stapeln gelieferten Analysedaten in Echtzeit in das System aufzunehmen, indem sie den Sperr-Overheads, den solche Stapel-Dateien oft mit sich bringen, für den Schreibvorgang entfernt. Damit ermöglicht sie dem System die Verarbeitung und die Analyse von massiven IoT-Datenmengen.

Schließlich müssen IIoT-Einsätze leicht zu integrieren und zu betreiben sein und gleichzeitig unter dem Gesichtspunkt der Gesamtbetriebskosten (TCO) effizient sein. Wenn Industrieunternehmen Datenbanken implementieren, die speziell für das IIoT entwickelt wurden, sind die Ergebnisse verblüffend: eine um 70 Prozent niedrigere TCO ist durchaus im Bereich des Möglichen, während gleichzeitig eine 100-fach höhere Leistung und das Potenzial für eine Multi-Petabyte-Skala erreicht wird.

(ID:46835636)