Definition

Was ist ein Data Scientist?

| Autor / Redakteur: Tutanch / Nico Litzel

(© aga7ta - Fotolia)

Ein Data Scientist wertet Daten systematisch aus und extrahiert Wissen. Auf Basis der gewonnenen Erkenntnisse unterstützt er die Unternehmensführung bei strategischen Entscheidungen. Data Scientists bewegen sich oft im Umfeld von Business Intelligence und Big Data.

Der Begriff Data Scientist lässt sich mit Datenwissenschaftler übersetzen. Es handelt sich um eine Berufsbezeichnung für eine Person, die über entsprechende Kenntnisse und Fähigkeiten verfügt, große Datenmengen systematisch auszuwerten und Wissen aus den Daten abzuleiten. Hierfür nutzt der Data Scientist praktische Methoden und theoretische Ansätze aus verschiedenen Wissenschaften wie der Informationstechnik und der Mathematik, speziell hier die Statistik oder die Wahrscheinlichkeitsrechnung.

Neben diesen fachlichen Fähigkeiten muss ein Data Scientist in der Lage sein, die gewonnenen Erkenntnisse anschaulich zu präsentieren und sie Dritten ohne spezifische Fachkenntnisse zu vermitteln. Er tritt gegenüber der Unternehmensführung in beratender Funktion auf und unterstützt diese bei strategischen Unternehmensentscheidungen.

Als Datengrundlage dienen dem Data Scientist sowohl strukturiert als auch unstrukturiert vorliegende Daten. Oft kommen bei der Datenanalyse Big-Data-Techniken zum Einsatz. Die Datenanalyse führt er entweder selbst durch oder er unterstützt IT-Spezialisten bei der Analyse beziehungsweise leitet sie an. Er kann auch als Projektleiter auftreten, der die verschiedenen Aufgaben und Tätigkeiten der Datenauswertung steuert und kontrolliert. Zunehmende Datenmengen im Unternehmen und der Fortschritt in den verschiedenen Big-Data-Bereichen lassen die Position des Data Scientists an Bedeutung gewinnen.

Unterscheidung zwischen Data Scientist, Data Analyst und Business Analyst

Oft kommt es zu einer Vermischung der Bezeichnungen Data Scientist, Data Analyst und Business Analyst. Die Begriffe lassen sich zwar nicht exakt voneinander abgrenzen und verschmelzen in einigen Teilbereichen miteinander, können aber dennoch in ihren grundsätzlichen Tätigkeitsfeldern unterschieden werden. Der Data Analyst betreibt klassische Datenanalyse, verfolgt aber keinen wissenschaftlichen Ansatz. Methoden der Künstlichen Intelligenz oder des Machine Learnings und weitere fortgeschrittene Analyse- und Vorhersagetechniken nutzt er nur in beschränktem Maße.

Ein Data Scientist ist in der Lage, innovative Methoden für seine Analysen zu nutzen und besitzt einen akademisch erweiterten Hintergrund. Die Fähigkeit, über den Tellerrand der reinen Datenanalyse zu schauen, zeichnet ihn aus. Business-Analysten können sich zwar auch mit der Datenanalyse beschäftigen oder sie durchführen, haben ihren Schwerpunkt aber mehr in der Analyse der Geschäftsmodelle und Geschäftserlöse. Sie werten Geschäftsmodelle IT-gestützt aus und nutzen zentrale KPIs und Werkzeuge wie Dashboards für ihre Arbeit.

Wichtige Eigenschaften und Fähigkeiten des Data Scientists

Ein Data Scientist beschäftigt sich mit unterschiedlichen Wissenschaftsbereichen und kann daher verschiedene akademische Hintergründe haben. Data Scientists können Informatiker, Physiker, Mathematiker oder Wirtschaftswissenschaftler sein, die sich entsprechende fortgebildet haben.

Mittlerweile existieren eigene Data-Science-Bachelor- oder -Master-Studiengänge, in denen alle wichtigen und benötigten Wissensgebiete vermittelt werden. Die Basis der Fähigkeiten eines Data Scientists bilden fachliche Kenntnisse aus den Bereichen der Statistik, der Mathematik, der Wahrscheinlichkeitsrechnung und der IT. Hinzu kommen die Methoden des Machine Learnings, der künstlichen Intelligenz und der Prognostik. Der Data Scientist befasst sich bei seiner Arbeit mit mathematischen Modellen, statistischen Verfahren und der Datenhaltung und Datenmodellierung. Er wendet diese unterschiedlichen Techniken und Algorithmen auf die vorhandenen Daten an und generiert dadurch Wissen. Als Tools und Programmiersprachen kommen beispielsweise Java, Python, R oder SQL zum Einsatz.

Neben diesen technischen Fertigkeiten muss der Data Scientist die Fähigkeit besitzen, die aus den Daten gewonnenen Erkenntnisse so aufzubereiten und zu erklären, dass deren Signifikanz für das Unternehmen leicht zu verstehen ist. Er leitet auf Basis der Ergebnisse Hypothesen ab und stellt Entscheidungsvorlagen für das Management zusammen. Bei erkannten Auffälligkeiten kann der Data Scientist selbstständig die richtigen Fragestellungen formulieren. Da er als eine Art Vermittler zwischen Fachabteilungen und Management auftritt, sind gute kommunikative Eigenschaften wichtig für den Erfolg seiner Arbeit. Im Rahmen der Datenanalyse fungiert er teilweise als Projektmanager und kontrolliert oder steuert die Aufgaben von der Datenbeschaffung über die Analyse bis zur Aufbereitung der Ergebnisse.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Advanced- und Predictive-Analytics-Initiativen

BARC-Studie

Advanced- und Predictive-Analytics-Initiativen

Mit 210 Teilnehmern aus der DACH-Region und einer breit gefächerten Branchenverteilung bietet die Studie „Advanced und Predictive Analytics“ Einblicke in die gegenwärtige und geplante Nutzung von fortgeschrittenen Analysen durch Unternehmen. lesen

Wenn die Daten sprechen

[Advertorial]

Herausforderung: variety in Big Data

Wenn die Daten sprechen

Er hat die höchste Dichte an Selfmade-Millionären, mehr als fünf Tennisplätze Grünfläche pro Einwohner und kostenlosen Nahverkehr. Was Sie schon immer mal über den besten Ort der Welt wissen wollten und nicht zu fragen wagten – so könnte der Untertitel für das Projekt „Paradise Found“ heißen. lesen

So orchestrieren Sie den Machine Learning Workflow

Kommentar von Dominik Claßen, Pentaho

So orchestrieren Sie den Machine Learning Workflow

Machine Learning boomt und dieser Boom ist mitnichten ein Silicon-Valley Marketing Hype, sondern für viele deutschen Unternehmen bereits Realität. Laut CRISP Research wird Machine Learning von einem Gros der Unternehmen hierzulande produktiv eingesetzt, was auch unsere Erfahrung widerspiegelt. lesen

Eindrücke von der größten Konferenz für die Data-Science-Sprache R

useR!2017

Eindrücke von der größten Konferenz für die Data-Science-Sprache R

Brüssel avancierte Anfang Juli zum Treffpunkt der weltweiten R-Community: 1.200 Teilnehmer aus über 50 Ländern trafen bei der useR!2017 in der Wild Gallery zusammen und erlebten die neusten Trends und Entwicklungen rund um die Data-Science-Sprache R. lesen

Ausbildung zum Data Scientist – was wird vermittelt?

Kommentar von Nikolaos Radouniklis, Data Reply

Ausbildung zum Data Scientist – was wird vermittelt?

Die Nachfrage nach Experten für Big Data steigt auch in diesem Jahr exponentiell, um die enormen Datenbestände zu analysieren und eine datengetriebene Kultur in den Unternehmen zu fördern. Damit der akute Bedarf an hochqualifizierten Data Scientists für die hiesigen Märkte annähernd gedeckt werden kann, hat Reply mit „The Data Incubator Reply“ (DIR) das erfolgreiche US-Ausbildungsprogramm von The Data Incubator nach Europa geholt. lesen

Das sind die 12 Erfolgsfaktoren von Data Science

Vom richtigen Toolset bis zur optimalen Kommunikation

Das sind die 12 Erfolgsfaktoren von Data Science

Data Mining, Künstliche Intelligenz, Neuronale Netze oder Maschinelles Lernen: Data Science kursiert derzeit unter vielen Begriffen. Ihnen gemeinsam ist die Extraktion von Wissen aus Daten – einem Thema, das Unternehmen aller Branchen, Universitäten und den gesellschaftlichen Diskurs zunehmend beschäftigt. lesen

6 Analytics-Prognosen für das Jahr 2017

Kommentar von Wolfgang Kelz, Tibco Software

6 Analytics-Prognosen für das Jahr 2017

Analysetechnologien werden auch in Zukunft nichts von ihrer Aktualität einbüßen: Denn die Zunahme von Maschinendaten aus dem Internet der Dinge führt zu neuartigen Anforderungen, Erwartungen und Verwendungsarten. lesen

Qlik, Tibco, ESRI und Tableau setzen auf Geo-Analytics

Location Intelligence und Datenvisualisierung

Qlik, Tibco, ESRI und Tableau setzen auf Geo-Analytics

Die Nachfrage nach Datenvisualisierung von räumlichen Daten nimmt zu – nicht nur in der Logistik, sondern auch im IoT-Sektor. Datenvisualisierung stellt nicht nur Zusammenhänge dar, sondern hilft auch, Verborgenes zu entdecken. Die Hersteller haben kürzlich bedeutende Erweiterungen ihrer Datenvisualisierungslösungen vorgestellt, so etwa Qlik, Tibco, ESRI und Tableau. lesen

Teradata rückt Beratung und Geschäftsnutzen stärker in den Vordergrund

Nachbericht Teradata Universe EMEA 2017

Teradata rückt Beratung und Geschäftsnutzen stärker in den Vordergrund

Teradata lud Anfang April ins südfranzösische Nizza zur europäischen Ausgabe der Hausmesse Teradata Universe ein. Rund 1.000 Teilnehmer ergriffen die Gelegenheit und informierten sich über aktuelle Analytics-Kundenprojekte. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44644885 / Definitionen)