Databricks, das Unternehmen hinter Spark, hat Version 1.4 des quelloffenen In-Memory-Frameworks zur Analyse von Daten in Echtzeit fertiggestellt.
Apache Spark 1.4 bietet jetzt eine Integration von SparkR.
(Apache Spark)
Apache Spark ist ein Open Source Big Data Framework, das ausschließlich auf In-Memory-Verarbeitung setzt und seit Erreichen des Top-Level-Status der Apache Software Foundation im Februar vergangenen Jahres bei Entwicklern auf große Zustimmung stößt.
In Version 1.4 bekommt Spark zudem mit IBM einen weiteren prominenten Fürsprecher, denn Big Blue hat seine Machine Learning Software „SystemML“ der Spark-Community zur Verfügung gestellt.
Diese Neuerungen bringt Spark 1.4
Die wichtigste Neuerung in Spark 1.4 ist allerdings die Integration von SparkR. R ist eine populäre, auf Statistik spezialisierte Programmiersprache mit Erweiterungen für die Datenverarbeitung und für maschinelles Lernen. Mit SparkR steht ein R-Frontend für Apache Spark zur Verfügung, das es Entwicklern ermöglicht, hochskalierbare Datenanalysen von der R-Shell aus anzustoßen. SparkR ist damit auch das erste neue Sprach-API seit der Integration von PySpark in das Big Data Framework im Jahr 2012.
Das API setzt auf das mit Spark 1.3 überarbeitete DataFrames-API auf. DataFrames sind eine Weiterentwicklung des RDD-Modells von Spark und nutzen den logischen Optimierer von Spark SQL zum Planen der physischen Ausführung von Operationen, damit diese auch bei großen Datensätzen gut funktionieren.
Darüber hinaus stellt die neue Version Streaming- und Core-Visualisierungs- sowie Monitoring-Komponenten für eine leistungsfähigere Fehlersuche zur Verfügung. Ferner haben in Spark 1.4 die mit Spark 1.3 als Preview eingeführten Machine Learning Pipelines, welche die Produktionsabläufe durch maschinelles Lernen mit einem eigenen API vereinfachen sollen, jetzt nicht mehr Alpha-Status. Weitere Neuerungen lassen sich der Veröffentlichungsankündigung entnehmen.
Spark wird immer beliebter
Einer Ende Januar von Typesafe durchgeführten Umfrage zufolge wird das Spark-Framework immer populärer, was auch auf andere Projekte abfärbt. So hat etwa MapR gerade gleich drei neue Erweiterungen zur Integration seiner MapR-Hadoop-Distribution mit Spark veröffentlicht. Darüber hinaus hat auch IBM mehrere Initiativen rund um Spark angekündigt.
(ID:43475804)
Stand vom 30.10.2020
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://support.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.