Ratgeber

Der Leitfaden für Dateningenieure zu Apache Spark

Bereitgestellt von: Databricks GmbH

Der Leitfaden für Dateningenieure zu Apache Spark

Dieses E-Book dient als Einführung in Apache Spark. Es führt den Leser durch die Kernarchitektur eines Clusters, verschiedene Spark-Anwendungen und die strukturierten APIs von Spark unter Verwendung von DataFrames und SQL.

Für einen angenehmeren Start mit Apache Spark, führt das E-Book Schritt für Schritt die Kernterminologie und Konzepte von Spark ein. Das Whitepaper richtet sich besonders an Dateningenieure. Diese erhalten zum einen eine Übersicht über verschiedene Toolsets von Apache Spark. Dies schließt beispielsweise Produktionsanwendungen, Machine Learning und Advanced Analytics sowie das Ökosystem von Paketen und Tools, das die Spark-Community geschafften hat. Abschließend wird die Arbeit mit verschiedenen Datentypen, wie Booleans, Strings, oder komplexen Datentypen, veranschaulicht.  Dazu zählt vor allem auch das konvertieren von Datentypen innerhalb von Spark.

Mit Klick auf den Button willige ich ein, dass Vogel meine Daten an den oben genannten Anbieter dieses Angebotes übermittelt und dieser meine Daten für die Bewerbung seines Produktes auch per E-Mail, Telefon und Fax verwendet. Zu diesem Zweck erhält er meine Adress- und Kontaktdaten sowie Daten zum Nachweis dieser Einwilligung, die er in eigener Verantwortung verarbeitet.
Sie haben das Recht diese Einwilligung jederzeit mit Wirkung für die Zukunft zu widerrufen.
Falls der verantwortliche Empfänger seinen Firmensitz in einem Land außerhalb der EU hat, müssen wir Sie darauf hinweisen, dass dort evtl. ein weniger hohes Datenschutzniveau herrscht als in der EU.

Bei Problemen mit dem Öffnen des Whitepapers deaktivieren Sie bitte den Popup-Blocker für diese Website. Sollten Sie weitere Hilfe benötigen, verwenden Sie bitte unser Kontaktformular.
Publiziert: 28.01.20 | Databricks GmbH

Anbieter des Whitepapers

Databricks GmbH

Leopoldstraße 244
80807 München
Deutschland