Flink-Runner für Googles Datenanalysedienst Google Cloud Dataflow auf Apache Flink

Anbieter zum Thema

Entwickler von Streamanalyse-Anwendungen können nun auch Flink als Plattform zum Ausführen von Dataflow-Pipelines in Googles Dataflow-Dienst nutzen. Einen solchen Runner für Googles Datenanalyse-Dienst gab es bisher nur für Apache Spark.

Flink-Runner für Googles Datenanalysedienst
Flink-Runner für Googles Datenanalysedienst
(Bild: Data Artisans)

Möglich macht dies ein vom Startup Data Artisans – dem Unternehmen hinter Apache Flink – gemeinsam mit Google und der Apache Flink Community entwickelter Flink-Runner für Googles Cloud Dataflow Service. Dieser erlaubt es Dataflow-Nutzern, Apache Flink als Backend zu nutzen.

Die Vorteile von Flink bei der Streamanalyse

So können Entwickler von Dataflow Pipelines diese ab sofort auch auf Basis der verteilten Processing-Engine eines Flink-Clusters laufen lassen. Der Vorteil besteht nach Angaben der Entwickler von Data Artisans in der Flexibilität und Leistungsfähigkeit von Flink sowie in der guten Portiertbarkeit. Da sich der Flink Runner wahlweise auf eigener Hardware oder in der Cloud verwenden lässt, können Dataflow-Pipelines damit auch außerhalb von Googles Cloud-Dienst ausgeführt werden. Derzeit klappt das zwar nur im Batch-Modus, die Entwickler arbeiten aber eigenen Angaben zufolge bereits an einer Umsetzung für den Streaming-Modus.

Google Dataflow

Google hatte den Dataflow-Service im vergangenen Jahr quasi als Nachfolger der eigenen MapReduce-Implementation vorgestellt. Der Dienst stammt von Googles FlumeJava und dem MillWheel-Projekt ab. Erst kürzlich hatte Google ein SDK für Dataflow unter einer Open-Source-Lizenz veröffentlicht.

Der Dienst befindet sich derzeit noch in der Erprobungsphase und kann Pipelines zum Analysieren von Streaming- und Batch-Daten schreiben, die dann in Googles Compute Engine laufen. Flink war erst im Januar dieses Jahres zum Top-Level-Projekt der Apache Software Foundation aufgestiegen.

(ID:43284054)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung