Suchen

Realtime-Streaming und Machine Learning Cloudera setzt auf Spark 2.0

| Autor / Redakteur: Matthias Semlinger / Nico Litzel

Neue Ergänzungen der Software sollen mehr Stabilität und Usability für den Produktionseinsatz von Big-Data-Anwendungen liefern. Cloudera will außerdem Community-Innovationen mit Apache Kudu 1.0 fördern.

Firmen zum Thema

Cloudera bringt eine neue Version seiner Software auf Basis von Spark 2.0 und präsentiert Kudu 1.0.
Cloudera bringt eine neue Version seiner Software auf Basis von Spark 2.0 und präsentiert Kudu 1.0.
(Bild: Cloudera)

Cloudera hat auf der Strata+Hadoop World in New York seine neue Version vorgestellt, die auf Apache Spark 2.0 (Beta) aufbaut und Verbesserungen bei der Behandlung von APIs, mehr Leistung und bessere Fähigkeiten im Bereich Machine Learning bringen soll.

Außerdem arbeitet Cloudera mit der Community an der Weiterentwicklung von Apache Kudu 1.0, das erst vor kurzem von der Apache Software Foundation veröffentlicht wurde.

Spark 2.0

Mit Spark 2.0 können Organisationen die Vorteile von Streaming-Daten besser nutzen, angereicherte Modelle zum Machine Learning entwickeln und in Echtzeit in Betrieb nehmen. Dadurch können sie mehr Workloads in die Produktion einbeziehen.

Spark 2.0 bietet unter anderem bessere Leistung und Bedienbarkeit mit der neuen Dataset API und strukturiertes Streaming für bessere Leistung und einfachere Aufnahme traditionell strukturierter Daten für Zeitserien, Tabellen und IoT-Daten.

Apache Kudu

Im September 2015 hat Cloudera die Beta-Version von Kudu veröffentlicht, seinem spaltenbasierten Speicher für Hadoop, der eine Kombination aus schnellen Analysen auf schnellen Daten ermöglichen soll.

Während Spark 2.0 Unternehmen besseren Zugang zu Streaming-Daten gibt, ermöglicht Kudu 1.0 Echtzeit-Anwendungsfälle mit hoher Geschwindigkeit. Zu den Funktionen von Kudu 1.0 zählen unter anderem eine vereinfachte Architektur ebenso wie Fehlertoleranz und Skalierbarkeit bis zu mehreren hundert Nodes.

(ID:44320684)