Aufbereitung und Analyse von Daten durch Data Scientists Big Data – auf Spezialisten warten Tausende neue Jobs

Redakteur: Nico Litzel

Bisher war die Auswertung großer Datenmengen nur in einigen wenigen Branchen üblich, doch nun zeigen immer mehr Unternehmen Interesse an Big Data. Allerdings sind qualifizierte Mitarbeiter rar, die die Datenberge nicht nur verwalten, sondern auch wertschöpfend für ein Unternehmen aufbereiten und auswerten können.

Firmen zum Thema

(Grafik: © Julien-Eichinger - Fotolia.com)

Big Data ist komplex und mitnichten ein Selbstläufer. Big Data unterscheidet sich nach Einschätzung von FICO, eines bereits 1956 gegründeten Anbieters von Predictive Analytics und Software für Entscheidungsmanagement, von einem „normalen“ gesteigerten Datenvolumen durch die Geschwindigkeit, Stichwort „Real Time“, und durch die Vielfältigkeit – strukturierte und unstrukturierte Daten, wie sie etwa in Foren und „Social“ Media anfallen.

Qualifizierte Experten, sogenannte Data Scientists, werden momentan händeringend gesucht. Beispielsweise haben auf dem Jobportal „indeed.com“ von Mitte 2011 bis Mitte 2012 Stellanzeigen für Data Scientists um 15.000 Prozent zugenommen. Der Unternehmensberater McKinsey geht davon aus, dass im Jahr 2018 zwischen 50 und 60 Prozent der offenen Stellen für Datenjongleure nicht besetzt werden können. Zu einer ähnlichen Einschätzung kommt Gartner. Das Analystenhaus prognostiziert, dass etwa nur jede dritte mit Big Data in Verbindung stehende Stelle bis 2015 besetzt sein wird.

Bildergalerie

„Sexiest Job of the 21st Century“

Das Fachmagazin „Harvard Business Review“ formulierte es kürzlich so: Data Scientist, das ist der „Sexiest Job of the 21st Century“. Was macht diesen Job so interessant und vor allem: Was macht einen guten Data Scientist aus?

Data Scientists sind nach Einschätzung von Gerald Fahner, Analytic Science Senior Director bei FICO, nicht nur technisch in der Lage, eine beliebige Zahl von Datensätzen auszuwerten, sondern sie müssten vor allem eines können: Die richtigen Fragen stellen und ein Gespür dafür haben, wie sie Daten im Hinblick auf die konkrete Fragestellung aus dem Kerngeschäft des Unternehmens oder des Auftraggebers analysieren müssen, um daraus die richtigen Schlüsse und Empfehlungen extrahieren zu können.

Im Kern gehe es darum, so Fahner, dass Data Scientists vor allem echte Problemlöser seien. Ihre Antworten müssten Antworten auf im realen Leben relevante Fragen liefern und sich letztlich positiv im Geschäftsergebnis des Unternehmens oder Auftraggebers niederschlagen.

Fahner erklärt, dass es dabei um Fragen geht wie „Welche Entscheidung soll mit der aktuellen Analyse optimiert werden?“, „Wie treffen wir diese Entscheidung im Moment?“ und „Wie messen wir die Verbesserung?“. Diese Fragen müssten gestellt und beantwortet sein, noch ehe der erste Datensatz aus der Datenbank gezogen wird, gibt Fahner zu bedenken.

Ein typischer Fall für Data Scientists kann so aussehen: Die meisten Unternehmen möchten ihre besten Kunden an sich binden. Das wirft einerseits die Frage auf, wer genau zu den besten Kunden zählt. Zum anderen ist es interessant zu wissen, was die Kundenbeziehung in Gefahr bringen kann. Andererseits, erklärt Fahner, sind die viel drängenderen Fragen, wie lange vor einem Ereignis, das einen Kunden womöglich zum Abwandern bringt, muss diese Vorhersage getroffen werden?

Zudem stellt sich die Frage, wie man eine Konstruktion findet, die genug Zeit zwischen der Prognose der möglichen Kundenabwanderung und möglichen Aktionen lässt, um rechtzeitig gegenzusteuern zu können.

Gute Data Scientists sind aber nicht nur Problemlöser. Sie müssen häufig noch einen Schritt vorher ansetzen. Ein wesentlicher Bestandteil eines Data Scientists ist es, relevante Probleme zu identifizieren und die zu beantwortenden Fragen so zu formulieren, dass aus deren Beantwortung ein echter Mehrwert entsteht.

Auch Einfühlungsvermögen ist gefragt

Aber nicht nur handfeste mathematische Kenntnisse sollte ein idealer Data Scientist mitbringen, sondern auch Einfühlungsvermögen. Neben einer wissenschaftlich geprägten Denkweise braucht es auch die Fähigkeit, mit den Business-Entscheidern auf einer Wellenlänge zu kommunizieren und sich mit ihnen austauschen zu können.

So sollte auf der einen Seite ein idealer Data Scientist in der Lage sein, die technischen Informationen aus der Datenanalyse in eine Sprache zu übersetzen, die auch ein Geschäftsführer versteht. Umgekehrt müssen Data Scientists in der Lage sein, die Business-Anforderungen des Managements in konkrete analytische Untersuchungen zu überführen.

Teamfähigkeit ist Pflicht

Jedoch sind Menschen, die von der robusten statistischen Modellierung über neueste Softwaretechnologien bis hin zu komplexen Geschäftsprozessen alles können und darüber hinaus auch noch mit Geschäftsführern und -entscheidern auf Augenhöhe parlieren können, sehr selten. Einzelkämpfern fehlt es meist schlicht an Bandbreite, um in der Data Science langfristig erfolgreich zu sein. Insofern liegt in der Fähigkeit zur Kooperation ein wichtiger Faktor für den Erfolg von Data Scientists.

Deswegen liegt der Schlüssel – wie so oft – in der Bildung von Teams, bestehend aus sich gut ergänzenden Kompetenzträgern mit einem gesunden Maß an inhaltlichen Überschneidungen. Bei den „soft skills“ gehören Offenheit, Hilfsbereitschaft und Delegationsbereitschaft ebenso zu den Erfolgsfaktoren wie eine Kultur der ständigen (Prozess-)Verbesserung und der Kollaboration. Wichtig ist daneben ein respektvoller Umgang mit abweichenden Meinungen sowie mit Kollegen und Kunden, die von Data Science weniger verstehen.

Durch diese Schnittstellenfunktion zwischen Business und Analytik und den unterschiedlichen Zielgruppen, mit denen ein Data Scientist kommuniziert, lässt sich nicht eindeutig bestimmen, welches Qualifikationsprofil die idealen Kandidaten für Data-Scientist-Positionen mitbringen sollten. Aber nach Einschätzung von FICO kommt es auch nicht darauf an, sondern vielmehr auf die individuellen Fähigkeiten und Denkweisen des Bewerbers. Von daher sind Mathematiker für diese Position ebenso gut geeignet wie Elektroingenieure oder Soziologen.

Große Verantwortung

Ein Data Scientist ist in erster Linie ein Wissenschaftler im klassischen Sinne. Daher ist auch eine „wissenschaftliche Ehrlichkeit“ oder „truth seeking behavior“ eine der wichtigsten Anforderungen. Es ist und bleibt eine moralische Gefahr für diesen Berufsstand, dass selbst ernannte Datenexperten durch eine unwissenschaftliche Herangehensweise genau die Dinge aus Daten herauslesen, die gerade vermeintlich gut ins Bild passen. Dieses Verhalten ist aber nicht nur falsch, sondern kann auch große Schäden verursachen, wenn aufgrund der ergebnisorientierten Analyse falsche Entscheidungen getroffen werden.

Keine Chance für Fachidioten

In der Datenwissenschaft gibt es wie in allen komplexen Gebieten vielfältige Quellen für „ehrliche Irrtümer“. Solide und erfahrene Data Scientists sind daher sehr vorsichtig und bescheiden. Sie werden jedes Ergebnis, auch wenn es den optimistischsten Erwartungen entspricht, erst noch einmal genauestens prüfen und anderweitig validieren, bevor sie es weitergeben und bekannt machen. Im Sinne der wissenschaftlichen Herangehensweise sollten dabei alle wichtigen Annahmen offengelegt werden – und der Weg zu den Ergebnissen sollte so weit wie möglich überprüfbar sein.

So variabel die Anforderungen an die Qualifikation und die praktische Tätigkeit sind, so unterschiedlich sind auch die Karrierewege, die ein Data Scientist einschlagen kann: Leitungsfunktionen in den Bereichen Vertrieb oder Finanzen gehören ebenso zu den Optionen wie Positionen auf Geschäftsführungsebene. Generell gilt: Je breiter ein Bewerber aufgestellt ist, desto besser sind seine Chancen.

Dieser Text stammt aus dem Kompendium „Einstieg in Big Data“ von Storage-Insider.de. Hier können Sie das komplette Kompendium kostenlos als PDF herunterladen.

(ID:42604778)