E-Book von BigData-Insider Streaming Analytics verbindet die Realwelt mit Erkenntnissen in Echtzeit

Autor / Redakteur: Michael Matzer / Nico Litzel

Events ereignen sich überall in der modernen Welt. Sei es eine Online-Bestellung, sei es das Buchen einer Lyft-Fahrt, die Log-Meldung eines IoT-Geräts oder die Transaktion in einem Banksystem – überall wird eine Kette von Events ausgelöst. Diese Event Streams lassen sich nicht nur in der jeweils passenden „Echtzeit“ erfassen, sondern auch flexibel verteilen, weiterverarbeiten und sogar „zurückspulen“. Ein Event-Streaming-System ist sowohl fehlertolerant als auch skalierbar – und leicht mit Apps zu nutzen.

Firmen zum Thema

Ab sofort steht das E-Book „Streaming-Analytics-Plattformen“ für leser von BigData-Insider kostenlos zum Download bereit.
Ab sofort steht das E-Book „Streaming-Analytics-Plattformen“ für leser von BigData-Insider kostenlos zum Download bereit.
(Bild: Vogel IT-Medien)

Event-Streaming unterstützt Unternehmen beispielsweise dabei, Chancen und Risiken über alle Daten hinweg in „Echtzeit“ zu erkennen, etwa in der Disziplin der Betrugserkennung oder bei der vorausschauenden Wartung und Instandhaltung. Damit ein Unternehmen in einem dynamischen Weltmarkt wettbewerbsfähig ist und bleiben kann, muss es indes in der Lage sein, seine vollständigen historischen Daten mit einem aktuellen Überblick über die relevanten Events, die in Echtzeit erfasst werden, zu verknüpfen. Erst dann ist Streaming Analytics wirklich effektiv.

Event Streaming, das die aktuelle Realität erfasst, lässt sich mithilfe leistungsfähiger Programmierschnittstellen mit vorhandenen Infrastrukturkomponenten wie etwa einer ETL/EBS-Middleware, einem Data Warehouse oder einem Data Lake integrieren. Auf diese Weise werden Investitionen bewahrt, aber das Gesamtsystem fit für die digitale Transformation gemacht.

Beispiel Apache Kafka

Apache Kafka ist beispielsweise eine Event-Streaming-Plattform, die Messaging, Storage, Stream Processing und Integration vereint. Als verteiltes System ist es hochverfügbar, hochskalierbar und fehlertolerant und somit für Big-Data-Anwendungen bestens geeignet. Apache Kafka verbessert herkömmliche Message Broker durch Weiterentwicklungen beim Datendurchsatz, bei der Partitionierung, Replikation, Latenz und letztlich Zuverlässigkeit.

Apache Kafka lässt sich in vielfältigen Bereichen einsetzen: Messaging, Echtzeit-Tracken der Aktivitäten von und auf Webseiten, Überwachen der operativen Kennzahlen von verteilten Anwendungen, Aggregation der Log-Dateien von zahlreichen Servern, Event Sourcing beim Protokollieren und Anfordern von Statusänderungen in einer Datenbank, Übergeben von Log- Dateien, in denen verteilte Systeme ihre Daten synchronisieren sowie Wiederherstellen von Daten nach dem Ausfall von Systemen.

Um auch Event Stream Analytics realisieren zu können, reicht Kafka nicht aus. Die meisten Plattformen, die u. a. von Analysten der Forrester Group untersucht und bewerten worden sind, verwenden entweder SQL oder eine eigene API, um die Anfragen zu formulieren. Interessant ist auch die vielfache Verwendung von Apache Beam, um solche Abfragen auch von anderen Streaming Engines ausführen lassen zu können.

Stärken und Schwächen

Jede Plattform weist ihre Stärken und Lücken auf, und die Forrester-Studie deckt diese auf und bewertet sie. So gibt es zwar alte Platzhirsche wie IBM, SAS und Cloudera, aber neue Rivalen wie EsperTech erlauben es, ihre Lösung in andere einzubetten, und wieder andere wie Snowplow konzentrieren sich darauf, das Verhalten von Kunden transparent zu machen – in Echtzeit, versteht sich. Man sieht, dass Streaming Analytics nicht nur etwas mit abstrakten Ereignissen auf irgendwelchen Sensoren und Endgeräten zu tun hat, sondern ganz direkt das menschliche Verhalten betreffen kann.

Das E-Book „Streaming-Analytics-Plattformen“ stellt die Grundlagen der Event Streams und ihrer exemplarischen Verarbeitung durch Apache Kafka vor, bevor alle 14 Anbieter der Forrester-Studie nebst Ergänzungen vorgestellt werden. Diese Marktübersicht demonstriert dem Leser, dass es beträchtliche Unterschiede unter den Streaming-Analytics-Plattformen gibt. Die Forrester-Bewertungen geben dem Leser Tipps, welche Plattform sich am besten für seine Zwecke und Anforderungen eignet.

Artikelfiles und Artikellinks

(ID:47637113)