Python-Support verbessert Cloudera baut Hadoop weiter aus

Autor / Redakteur: Martin Hensel / Nico Litzel

Cloudera verbessert die Unterstützung von Python durch eine Kooperation mit dem Anaconda-Urheber Continuum Labs. Zudem engagiert sich das Unternehmen im Gemeinschaftsprojekt Apache Arrow.

Anbieter zum Thema

Cloudera erweitert den Python-Support von Hadoop kontinuierlich.
Cloudera erweitert den Python-Support von Hadoop kontinuierlich.
(Bild: Cloudera)

In der letzten Zeit hatte Cloudera bereits verschiedene Neuerungen rund um Apache Spark und Python vorgestellt, die verbessertes Data Engineering und die optimierte Verarbeitung von Data-Science-Workloads auf Big-Data-Basis ermöglichten. Für Datenwissenschaftler und -techniker ist die Sprache Python unter anderem wegen ihrer Leistung und der stabilen Bibliotheken bei der Darstellung komplexer Workflows beliebt.

Anaconda an Bord

Um den Einstieg in die Arbeit mit Python zu erleichtern, kooperiert Cloudera ab sofort mit Continuum Analytics, dem Anbieter der Open-Source-Python-Plattform Anaconda. Das gemeinsam entwickelte Anaconda-Paket für Cloudera ermöglicht die schnelle Kundeninstallation von Python auf einem Hadoop-Cluster inklusive beliebter Produkte wie NumPy, Pandas und Scikit-Learn. Über den Cloudera Manager lässt sich Anaconda von den Anwendern nahtlos einsetzen. Mittels Cloudera Enterprise lassen sich auf einfache Weise und auch unter Spark Python-basierte Lösungen aufbauen und betreiben.

Arrow wird unterstützt

Cloudera gab außerdem bekannt, gemeinsam mit Entwicklern von Amazon, Databricks, Dremio, MapR, Trifacta und Twitter am Apache-Arrow-Projekt zu arbeiten. Die neuartige, spaltenbasierte In-Memory-Datenstruktur soll das In-Memory-Processing und den Datenaustausch innerhalb des Ökosystems vereinheitlichen. Zudem werden analytische Workloads auf Hadoop-Frameworks beschleunigt. Es besteht native Interoperabilität mit Sprachen wie Python und R, was für verbesserten Datenzugriff sorgt und High-Performance-Analysen ermöglicht.

(ID:43902124)