Kommentar von Nikolaos Radouniklis, Data Reply Ausbildung zum Data Scientist – was wird vermittelt?

Autor / Redakteur: Nikolaos Radouniklis / Nico Litzel |

Die Nachfrage nach Experten für Big Data steigt auch in diesem Jahr exponentiell, um die enormen Datenbestände zu analysieren und eine datengetriebene Kultur in den Unternehmen zu fördern. Damit der akute Bedarf an hochqualifizierten Data Scientists für die hiesigen Märkte annähernd gedeckt werden kann, hat Reply mit „The Data Incubator Reply“ (DIR) das erfolgreiche US-Ausbildungsprogramm von The Data Incubator nach Europa geholt.

Anbieter zum Thema

Der Autor: Nikolaos Radouniklis ist Partner der Data Reply GmbH, einem Tochterunternehmen der Reply AG
Der Autor: Nikolaos Radouniklis ist Partner der Data Reply GmbH, einem Tochterunternehmen der Reply AG
(Bild: Data Reply)

Ziel ist es, Fachkräfte auszubilden, die die Arbeit mit Big Data aus wissenschaftlicher und aus praktischer Perspektive beherrschen und damit die Basis für die Innovationsfähigkeit von Unternehmen bilden.

Der Data Incubator Reply (DIR) ist ein Ausbildungsprogramm zum Berufsbild Data Scientist, das den Praxistest in den USA bereits bestanden und sich als äußerst erfolgreich erwiesen hat. Das Programm bietet eine Mischung aus Technologie und Unternehmensnähe – und das erstmals in Europa. Die Studenten oder Mitarbeiter aus Unternehmen, die den Data Incubator absolviert haben, können später als Data Scientists branchenunabhängig und -übergreifend in vielen Bereichen eingesetzt werden: Das Spektrum reicht von der Auswertung von medizinischen Daten oder Daten aus dem Verkehrswesen über die Analyse von Aktienmärkten bis hin zu einer effizienten Verbrechensbekämpfung.

Das Ausbildungsprogramm besteht aus vier Hauptkomponenten: Boot-Camp-Modulen, Seminaren, ersten Projekten und Gesprächen mit potenziellen Arbeitgebern. In den Boot-Camp-Modulen werden den Teilnehmern technische und nicht-technische Fähigkeiten vermittelt. Data Scientists, die bereits voll im Berufsleben stehen, halten Seminare, in denen sie aus ihrer täglichen Praxis berichten. Um den späteren Einstieg in den Berufsalltag zu erleichtern, erstellen die Auszubildenden eine Serie kleiner Projekte, um vor allen Programmierkenntnisse und mathematische Kenntnisse zu präsentieren. Praktische Erfahrungen werden bei der Anwendung der Tools gesammelt, die Arbeitgeber auf ihre eigenen Datenbanken anwenden – und das mithilfe eines Clusters, der aus 100 Nodes besteht. Das Programm rundet Gespräche mit potenziellen Arbeitgebern ab, die auf der Suche nach den besten Bewerbern sind.

Ausbildungsinhalte – Schwerpunkt auf Technologien

Um direkt in der Industrie durchstarten zu können, stehen Software Engineering und numerische Berechnungen, natürliche Sprachverarbeitung, Statistik und Visualisierung von Daten sowie Datenbanken und Parallelisierung auf dem Lehrplan. Im Rahmen der Ausbildung werden die Teilnehmer zunächst an zentrale Technologien wie Software Engineering und numerische Berechnung herangeführt. Dies beinhaltet numerische Techniken zur Optimierung sowie vektorbasierte lineare Algebra. Die Programmiertools umschließen Python, Numpy, Scipy, Scikit-learn und Matplotlib.

Ein weiterer Schwerpunkt ist die natürliche Sprachverarbeitung mit der Handhabung unstrukturierter Daten, dem Stemming, Bag of Words, TF/IDF und Topic Modeling. Der Programmpunkt Statistik beinhaltet das Testen von Hypothesen, ferner Regression und Klassifikation, Ensemblemethoden, Kreuzvalidierungsverfahren, Bias-Varianz-Zerlegung und Datennormalisierung. Weitere Kursinhalte drehen sich um die Visualisierung von Daten sowie Datenbanken und Parallelisierung.

Aber auch die sogenannten Soft Skills spielen eine wichtige Rolle: An erster Stelle stehen die Kommunikationsfähigkeiten. Akademiker und Beschäftigte in der Industrie kommunizieren auf verschiedene Art und Weise. Die angehenden Data Scientists lernen, wie übliche Fehler vermieden werden und wie trotz schwieriger technischer Themen eine verständliche Sprache möglich ist. Dabei erhalten sie Tipps und Empfehlungen zum Networking, um ihre Karriere voranzutreiben. Denn auch ein Praxistraining gehört zum Programm: Die Teilnehmer trainieren Interviews, um technische Themen gut verständlich zu kommunizieren. Das ist mindestens genauso wichtig wie die Vermittlung des Praxiswissens.

Vorteile für Studenten und Unternehmen

Das Ausbildungsprogramm bietet Studenten und Unternehmen viele Vorteile. Im Prinzip erhalten die allerbesten Studenten das Training kostenlos. Mit den kontinuierlichen Unterrichten und Projekten verbessern sie ihre analytischen Fähigkeiten sowie ihre Kommunikationsfähigkeiten. Die Studenten erhalten praktische Erfahrung, indem sie die Tools anwenden, die Arbeitgeber in der Praxis auf ihre eigenen Datenbanken anwenden. Zu guter Letzt bauen die Studenten ihr Netzwerk mit den richtigen Leuten auf, das für ihre neue Karriere essentiell wichtig ist.

Das Programm bietet Unternehmen nicht nur die Möglichkeit ihre Mitarbeiter mit den neuesten Technologien und Techniken zu trainieren, sondern auch der nächsten Generation von Data Scientists vorzustellen. Die Unternehmen haben exklusiven Zugang, um die besten Absolventen einzustellen. Sie wurden von Top Data Scientists ausgewählt und trainiert, was den Unternehmen die Zeit eines Auswahlverfahrens und On-the-Job-Trainings erspart. Unternehmen profitieren von weiteren Angeboten: Verschiedene Sponsoring-Pakete bieten neben der Möglichkeit, eigene Mitarbeiter auszubilden, auch sich als Technologie-Partner zu platzieren, Use Cases einzubringen und als Innovator im Bereich Big Data zu platzieren.

Das Programm erfreut sich reger Resonanz: Wir freuen uns über zahlreiche Bewerbungen von hochmotivierten Studenten. So stellen wir sicher, dass wir Top-Leute auswählen und ausbilden können. Davon profitieren die Unternehmen, in denen die angehenden Data Scientist tätig werden.

(ID:44673271)