Ratgeber
Der Leitfaden für Dateningenieure zu Apache Spark
Dieses E-Book dient als Einführung in Apache Spark. Es führt den Leser durch die Kernarchitektur eines Clusters, verschiedene Spark-Anwendungen und die strukturierten APIs von Spark unter Verwendung von DataFrames und SQL.
Für einen angenehmeren Start mit Apache Spark, führt das E-Book Schritt für Schritt die Kernterminologie und Konzepte von Spark ein. Das Whitepaper richtet sich besonders an Dateningenieure. Diese erhalten zum einen eine Übersicht über verschiedene Toolsets von Apache Spark. Dies schließt beispielsweise Produktionsanwendungen, Machine Learning und Advanced Analytics sowie das Ökosystem von Paketen und Tools, das die Spark-Community geschafften hat. Abschließend wird die Arbeit mit verschiedenen Datentypen, wie Booleans, Strings, oder komplexen Datentypen, veranschaulicht. Dazu zählt vor allem auch das konvertieren von Datentypen innerhalb von Spark.
Anbieter des Whitepapers
Kostenloses Whitepaper herunterladen