Analytics von Streaming-Daten Visual Data Discovery im Sekundentakt

Autor / Redakteur: Patrick Benoit / Nico Litzel

Das Volumen an Streaming-Daten explodiert geradezu. Sie stammen von vernetzten Maschinen, Geräten, Sensoren und aus user-generiertem Content. Jede einzelne dieser Quellen liefert gigantische Mengen hochaktueller Daten.

Firmen zum Thema

Beispiel eines Dashboards von Datawatch, bei dem Daten von verschiedenen Quellen in Echtzeit gestreamt werden.
Beispiel eines Dashboards von Datawatch, bei dem Daten von verschiedenen Quellen in Echtzeit gestreamt werden.
(Bild: Datawatch)

Die Analyse von Streaming-Daten ist nichts grundsätzlich Neues. Sie wird auf den Kapitalmärkten schon seit langem praktiziert. Transaktionen werden hier in Millisekunden abgewickelt. Entsprechend schnell kann sich die Risikostruktur in einem Portfolio ändern.

Heute setzt sich die Nutzung von Streaming-Daten in der Lieferkette, im Kundenservice und im Marketing immer stärker durch. Der Einzelhandel, die Medien, das Gesundheitswesen, die Energiebranche und der Maschinenbau setzen auf Big Data bei der Steuerung von Kommunikation, Prozessen, Produktionsanlagen und in der Wartung. Gartner erwartet, dass 2017 mehr als die Hälfte der Analytics-Implementationen ereignisgesteuerte Datenströme nutzen werden, die von Maschinen, Anwendungen und Personen stammen.

Bildergalerie

Traditionelle BI-Tools stoßen an Grenzen

Je kurzfristiger Daten zur Verfügung stehen, umso schneller wollen die Anwender diese auch auswerten können. Nach Ansicht von Dr. Wolfgang Martin, einem der führenden europäischen BI-Analysten, können traditionelle BI-Tools wie Berichtserstellungswerkzeuge, Dashboards, Ad-hoc-Anfragen, OLAP - Online Analytical Processing und auch Tabellen keine wirklich neuen Einblicke liefern. Denn sie dienen nur der Zusammenfassung und Diagnose von Daten sowie der Beantwortung bekannter, zuvor festgelegter Fragen.

Die Daten müssen hierzu mithilfe der IT modelliert werden, um semantische Layer und Berichte vorzubereiten, die dann zentral an die Anwender verteilt werden. Diese Werkzeuge sind daher nicht geeignet für dynamische Umgebungen, in denen man fortlaufend neue Fragen stellen und beantworten muss.

Neues entdecken

Tools für Visual Data Discovery zeigen dagegen bisher unbekannte Zusammenhänge, Trends, Anomalien und Ausreißer, die Anlass geben für völlig neue Fragestellungen und für eine tiefergehende Untersuchung. Dazu lassen sich verschiedenste Datenquellen verknüpfen. Doch nicht alle Visual-Data-Discovery-Anbieter kommen mit Big Data und mit Streaming-Daten zurecht.

Dabei bietet die Visualisierung von Streaming-Daten einen enormen Vorteil: Man kann bereits bei den ersten Anzeichen eines Problems reagieren. Datenvisualisierung ist ein interaktiver, problembezogener Prozess, der ad hoc intuitive Analysen zulässt.

Visuelle Analysen eignen sich besonders, um große Datenmengen, komplexe Datenstrukturen oder eben Echtzeitdaten zu überwachen und zu analysieren. Denn große Datenmengen und komplexe Datenstrukturen werden durch Visualisierung übersichtlich. Die grafische Darstellung unterstützt das hervorragend ausgeprägte Erkennen von Mustern durch das menschliche Auge.

So lassen sich beispielsweise Ausreißer leicht erkennen und strukturelle Änderungen gleichsam ablesen. Die Daten sollten dazu so wenig wie möglich aggregiert werden – ein weiterer wesentlicher Unterschied zu traditionellen BI-Anwendungen.

Unternehmen, die Streaming-Daten integrieren und analysieren können, verbessern ihre Prozesse, sichern ihre Systeme und identifizieren neue Geschäftschancen. Das setzt jedoch voraus, wichtige von unwichtigen Informationen unterscheiden zu können. Dazu gehört der Abgleich mit Standards und mit historischen Daten, um im größeren Kontext die richtigen Entscheidungen treffen zu können. Sonst würde beispielsweise schon ein überhöhter, aber unkritischer Sensorwert zur sofortigen Abschaltung einer Maschine führen.

Visual Data Discovery arbeitet mit detaillierten Rohdaten, ganz egal, aus welcher Datenquelle sie stammen. Das können statische Berichte, PDF-Dateien, Electronic Data Interchange Streams oder Echtzeit-Datenquellen, wie etwa CEP-Engines (Complex Event Processing) oder Ticker- und HANA-Datenbanken sein. So hat sich in den vergangenen Jahren eine neue Klasse von Anwendungen entwickelt, wie etwa die von Datawatch, die Datenstreams direkt aus Quellen wie IBM InfoSphere verarbeiten können.

Lösungen für den Business-Anwender

Dank einer intuitiven visuellen Benutzeroberfläche sowie einer mächtigen Bibliothek mit unterschiedlichen Darstellungsformen für Zeitreihendaten sowie Torten- und Balkendiagramme, Dot- und Scatterplots, Heat Maps, Tree Maps und anderen Grafiken können auch statistisch und analytisch nicht geschulte Nutzer interne und externe Datenquellen einschließlich Big-Data-Quellen für das Monitoring und die Analyse von Streaming-Daten nutzen.

Echtzeitdaten werden entweder direkt visualisiert und/oder per Video-Recorder aufgezeichnet und als Animation zur Verfügung gestellt. Weiterhin kann mittels Regeln eine Benachrichtigungs-Engine aufgesetzt werden, die im Sinne von Ereignisverarbeitung automatisch Alarm schlägt, wenn Risiken im Datenstrom erkennbar werden.

Über die Datenvisualisierung lässt sich dann schnell identifizieren, welche Abweichung den Alert ausgelöst und wie sie sich im Kontext von Daten aus der Vergangenheit einordnen lässt. Visual Data Discovery hilft auch bei der Überwachung und Steuerung von Prozessen. Damit nicht genug. Es können dann auch Prognosemodelle abgeleitet werden, die wiederum Prozesse anreichern, indem sie analytische Services in Geschäftsprozesse und Anwendungen integrieren. Das schafft intelligente Prozesse, die Probleme bereits vor Entstehung erkennen und lösen.

Wettbewerbsvorteile sichern

Datenvisualisierung hilft Managern und Mitarbeitern, Entscheidungen schneller zu treffen, denn Ausreißer und Anomalien werden auf einen Blick erkennbar. Sie analysieren, simulieren und visualisieren größte Datenmengen im Handumdrehen, auch in Echtzeit, und erhalten sofort Antworten auf Fragen, die sich oft erst während der Analyse ergeben. So entdecken sie Chancen oder Risiken noch vor dem Wettbewerb.

(ID:43040871)