Suchen

Parallele Datenverarbeitung und Cluster-Überwachung Apache Beam und Apache Eagle werden Toplevel-Projekte

| Autor / Redakteur: Dipl. -Ing. Thomas Drilling / Nico Litzel

Die Apache Software Foundation hat Beam und Eagle zu neuen Toplevel-Projekten befördert. Apache Beam eignet sich als Fundament für parallele Datenverarbeitung und bei Eagle handelt es sich um ein Projekt, das große Cluster überwachen kann.

Firma zum Thema

(Bild: The Apache Software Foundation)

Die große Familie der Apache-Big-Data-Projekte erhält Zuwachs. Die beiden dem Big-Data-Sektor zuzuordnenden ASF-Projekte Apache Beam und Apache Eagle haben den Inkubator-Satus verlassen.

Apache Eagle

Apache Eagle versteht sich als Analyse-Plattform mit deren Hilfe sich Sicherheits- oder Geschwindigkeitsproblemen auf Datenverarbeitungsplattformen wie Hadoop oder Spark schnell und effizient identifizieren lassen sollen. Eagle analysiert dazu Datenaktivitäten, YARN-Anwendungen, JMX-Metriken, Daemon-Logs und Vieles mehr.

Eagle ist ursprünglich bei eBay entstanden und wurde hier zur Überwachung eines sehr großen Hadoop-Clusters eingesetzt. eBbay hat das Projekt 2015 in die Community entlassen und dem Inkubator der ASF übergeben. Seitdem hat Eagle für viel Aufmerksamkeit bei Organisationen und Entwicklern gesorgt, denn Eagle ist flexibel einsetzbar und überwacht Systeme, Dienste oder Anwendungen.

So kann Eagle beispielsweise den Durchsatz von Anwendungen überwachen oder Performance-Einbrüche bei Servern erkennen. Zudem ist Eagle gut erweiterbar und skaliert gut.

Das Projekt ist aktuell in Version 0.4.0 verfügbar. Weitere Informationen zu Eagle finden sich auf der Projektseite.

Apache Beam

Das Projekt Apache Beam versteht sich als Programmiermodell, das das Erstellen einer parallelen Datenverarbeitungs-Pipeline vereinheitlicht und künftig mehrere SDKs bereitstellen soll. Aktuell gibt es allerdings nur JDK. Ausgeführt wird die Pipeline unter einer der unterstützten Engines wie z. B. Apache Spark, Apache Flink, Apache Apex und Google Cloud Dataflow.

Beam ist anscheinend aus Google Cloud Dataflow hervorgegangen. Aktuell nutzen Google, PayPal und Talend Apache Beam, das aktuell ebenfalls in Version 0.4.0 vorliegt.

Weitere Informationen zu Beam und Download-Möglichkeiten finden Interessenten auf der Projektseite.

Dieses Jahr steht bei derart vielen Apache-Projekten die Verarbeitung von großen Datenmengen im Vordergrund, sodass auch 2017 die jährliche stattfindende ApacheCon in zwei Teilkonferenzen gesplittet wird, die allerdings zeitgleich stattfinden: „ApacheCon: Core“ und „Apache: Big Data“.

(ID:44461052)

Über den Autor

Dipl. -Ing. Thomas Drilling

Dipl. -Ing. Thomas Drilling

IT-Consultant, Trainer, Freier Journalist