Kommentar von Matthias Maier, Splunk

Maschinendaten liefern Antworten auf fast alle Fragen

| Autor / Redakteur: Matthias Maier / Nico Litzel

Der Autor: Matthias Maier ist Security Evangelist bei Splunk
Der Autor: Matthias Maier ist Security Evangelist bei Splunk (Bild: Splunk)

Wenn es um die Analyse von Big Data geht, sind häufig all diejenigen Informationen gemeint, die klar einsehbar in den Datenbanken der Unternehmen liegen. Diese auszuwerten ist in vielen Fällen eine große Herausforderung – schon allein aufgrund der ungeheuren Datenmenge.

Noch mehr Potenzial steckt jedoch in einer anderen Art von Daten: den „bekannten Unbekannten“. Dass diese Informationen vorliegen, ist allen Beteiligten klar. Es erscheint auf den ersten Blick nur nicht ganz leicht, diese auch zu nutzen. Denn sie lagern verborgen in den unterschiedlichsten Geräten innerhalb eines Netzwerks. Dabei kann es sich um Kommunikationsdaten zwischen Maschinen (M2M), die Interaktion von Mensch und Maschine oder die Kommunikation zwischen zwei Personen mithilfe der Maschine handeln.

Auf diese Weise entstehen gigantische Datenmengen, die nach einer aktuellen Untersuchung von IDC um 40 Prozent pro Jahr wachsen. Zu den Quellen zählen dabei die klassischen IT-Systeme, aber auch Consumer-Applikationen, Cloud-Computing-Anwendungen, mobile Geräte, Social-Media-Plattformen und natürlich mit steigender Bedeutung das Internet der Dinge beziehungsweise die Industrie 4.0.

Verstreute Informationen in den unterschiedlichsten Formaten

Das Problem dabei: Meist liegen die Informationen verstreut in den unterschiedlichsten Formaten auf mehreren Teilen des Gesamtsystems – in der Regel unstrukturiert. Ihnen gemeinsam ist, dass sie sich in einem ständigen Fluss bewegen und häufig in unvorstellbar großer Masse auftreten.

Kann man diesen Datenschatz heben, sind die Informationen gleich für mehrere Stellen im Unternehmen relevant. In sehr vielen Fällen könnten die IT-Abteilung, der Vertrieb, das Marketing, die Entwicklungsabteilung und der Support aus ein und demselben Datensatz relevante Informationen ziehen. In der Praxis scheitert es jedoch häufig daran, die verschiedenen Datensilos aufzubrechen und die Informationen in eine verwertbare Form zu bringen.

Die Deutsche Bahn macht es vor

Ein Beispiel aus der Praxis verdeutlicht das. Die Deutsche Bahn zeigt, wie die gezielte Auswertung von Maschinendaten einen hohen Mehrwert bringt. Die Bahn stellte Daten im Rahmen eines Hackathons Unternehmen und Einzelkämpfern frei zur Verfügung.

Das Ziel: Antworten auf eine umfangreiche Sammlung komplexer Fragen zu bekommen: „Lassen sich aus den zur Verfügung gestellten Daten Begründungen oder Modelle für die Entstehung von Gleislagefehlern herleiten? Wenn ja, wie sehen die Modelle und Begründungen aus? Sind Gleislagefehler prognostizierbar, bevor sie entstehen? Welche Zusammenhänge bestehen zwischen Gleislagefehlern und der verwendeten Technik auf dem Streckenabschnitt (zum Beispiel Holzschwelle versus Betonschwelle), dem Alter der Technik oder den Wetterbedingungen? Gibt es Zusammenhänge zu den Befund- oder Störmeldungen? Sind Entwicklungen von Gleislagefehlern erkennbar?“

Die Daten für diese Aufgabe kamen aus verschiedenen Quellen wie SAP R/3, Microsoft Internet Information Services und STREDA. Sie umfassten Infrastrukturstammdaten, Störmeldungen, Inspektions- und Reparaturaufträge, Meldungen über Gleislagefehler und unzählige weitere Parameter. Die meisten dieser Daten waren unstrukturiert und mussten erst in einen geeigneten Zusammenhang gebracht werden.

Sinnvolle Verknüpfung

Mithilfe von Splunk Enterprise, einer Plattform für Operational Intelligence, wurden die Informationen in Form gebracht und sinnvoll miteinander verknüpft. Dabei mussten unzählige Daten wie die geografischen Gegebenheiten, verwendete Komponenten, Fahrplandaten, Fehlermeldungen, Materiallisten und Baudokumentationen miteinander korreliert werden.

Die Analyse hat sich gelohnt. So konnte das Splunk-Team erhebliches Verbesserungspotenzial bei der Bahn-Infrastruktur identifizieren und zum Beispiel evaluieren, ob Betonschwellen oder Holzschwellen mehr Probleme bereiten oder in welchen Streckenabschnitten erhöhte Gleislagefehler bestehen.

Die Experten beim Hackathon benötigten dafür rund 24 Stunden nonstop. Mit konventionellen Methoden hätte die Deutsche Bahn die Analyse Wochen oder gar Monate gekostet. Kein Wunder, dass das Team den ersten Preis für diese Leistung holte.

Aus Big Data die richtigen Schlüsse ziehen

Das Beispiel zeigt, wie es mit Analytics-Software möglich ist, komplexe Systeme zu durchschauen und zu optimieren. Dazu werden jeweils Maschinendaten aus der gesamten Systemlandschaft gesammelt, indiziert und analysiert. So erhalten Unternehmen einen zentralen Zugang zu allen Informationen und ein detailliertes Bild der Vorgänge rund um strategische Fragestellungen. Mithilfe von verschiedenen grafischen Darstellungsformen ist es dabei einfach, auch in komplexen Situationen den optimalen Durchblick zu erhalten.

Voraussetzung ist, dass die eingesetzte Software sämtliche Ausgangsdaten versteht, die Maschinen jeder Art liefern. Durch die Search Processing Language (SPL) lassen sich damit sowohl Echtzeit- als auch historische Daten mit Blick auf sämtliche Dimensionen ganz einfach durchsuchen. Zugleich ist es möglich, Muster und Grenzwerte zu überwachen und zu erkennen und etwa einen Alarm auszugeben sobald bestimmte Bedingungen erfüllt sind.

Auch mit Blick auf die Auswertung und Analyse sind solche Plattformen ausgesprochen leistungsfähig. Darunter fallen zum Beispiel frei anpassbare Dashboards mit Ansichten für verschiedene Rollen und Ebenen, inklusive granularer Zugriffsrechte. Zugleich läuft die Lösung auf herkömmlichen Rechnern On-Premise oder in der Cloud.

Analytics-Lösungen sind daher das Mittel der Wahl, um aus Big Data die richtigen Schlüsse zu ziehen: Egal ob es sich um einen E-Commerce-Anbieter handelt, der mehr darüber erfahren möchte, an welcher Stelle des Prozesses Kunden den Einkauf abbrechen oder um einen technischen Experten, der die Laufzeit einer Maschine optimieren möchte: In den Maschinendaten liegen die Antworten zu (fast) allen Fragen in einer zunehmend digitaleren Welt.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 44097093 / Data Sourcing)