Definition

Was ist ein Data Scientist?

| Autor / Redakteur: Tutanch / Nico Litzel

(© aga7ta - Fotolia)

Ein Data Scientist wertet Daten systematisch aus und extrahiert Wissen. Auf Basis der gewonnenen Erkenntnisse unterstützt er die Unternehmensführung bei strategischen Entscheidungen. Data Scientists bewegen sich oft im Umfeld von Business Intelligence und Big Data.

Der Begriff Data Scientist lässt sich mit Datenwissenschaftler übersetzen. Es handelt sich um eine Berufsbezeichnung für eine Person, die über entsprechende Kenntnisse und Fähigkeiten verfügt, große Datenmengen systematisch auszuwerten und Wissen aus den Daten abzuleiten. Hierfür nutzt der Data Scientist praktische Methoden und theoretische Ansätze aus verschiedenen Wissenschaften wie der Informationstechnik und der Mathematik, speziell hier die Statistik oder die Wahrscheinlichkeitsrechnung.

Neben diesen fachlichen Fähigkeiten muss ein Data Scientist in der Lage sein, die gewonnenen Erkenntnisse anschaulich zu präsentieren und sie Dritten ohne spezifische Fachkenntnisse zu vermitteln. Er tritt gegenüber der Unternehmensführung in beratender Funktion auf und unterstützt diese bei strategischen Unternehmensentscheidungen.

Als Datengrundlage dienen dem Data Scientist sowohl strukturiert als auch unstrukturiert vorliegende Daten. Oft kommen bei der Datenanalyse Big-Data-Techniken zum Einsatz. Die Datenanalyse führt er entweder selbst durch oder er unterstützt IT-Spezialisten bei der Analyse beziehungsweise leitet sie an. Er kann auch als Projektleiter auftreten, der die verschiedenen Aufgaben und Tätigkeiten der Datenauswertung steuert und kontrolliert. Zunehmende Datenmengen im Unternehmen und der Fortschritt in den verschiedenen Big-Data-Bereichen lassen die Position des Data Scientists an Bedeutung gewinnen.

Unterscheidung zwischen Data Scientist, Data Analyst und Business Analyst

Oft kommt es zu einer Vermischung der Bezeichnungen Data Scientist, Data Analyst und Business Analyst. Die Begriffe lassen sich zwar nicht exakt voneinander abgrenzen und verschmelzen in einigen Teilbereichen miteinander, können aber dennoch in ihren grundsätzlichen Tätigkeitsfeldern unterschieden werden. Der Data Analyst betreibt klassische Datenanalyse, verfolgt aber keinen wissenschaftlichen Ansatz. Methoden der Künstlichen Intelligenz oder des Machine Learnings und weitere fortgeschrittene Analyse- und Vorhersagetechniken nutzt er nur in beschränktem Maße.

Ein Data Scientist ist in der Lage, innovative Methoden für seine Analysen zu nutzen und besitzt einen akademisch erweiterten Hintergrund. Die Fähigkeit, über den Tellerrand der reinen Datenanalyse zu schauen, zeichnet ihn aus. Business-Analysten können sich zwar auch mit der Datenanalyse beschäftigen oder sie durchführen, haben ihren Schwerpunkt aber mehr in der Analyse der Geschäftsmodelle und Geschäftserlöse. Sie werten Geschäftsmodelle IT-gestützt aus und nutzen zentrale KPIs und Werkzeuge wie Dashboards für ihre Arbeit.

Wichtige Eigenschaften und Fähigkeiten des Data Scientists

Ein Data Scientist beschäftigt sich mit unterschiedlichen Wissenschaftsbereichen und kann daher verschiedene akademische Hintergründe haben. Data Scientists können Informatiker, Physiker, Mathematiker oder Wirtschaftswissenschaftler sein, die sich entsprechende fortgebildet haben.

Mittlerweile existieren eigene Data-Science-Bachelor- oder -Master-Studiengänge, in denen alle wichtigen und benötigten Wissensgebiete vermittelt werden. Die Basis der Fähigkeiten eines Data Scientists bilden fachliche Kenntnisse aus den Bereichen der Statistik, der Mathematik, der Wahrscheinlichkeitsrechnung und der IT. Hinzu kommen die Methoden des Machine Learnings, der künstlichen Intelligenz und der Prognostik. Der Data Scientist befasst sich bei seiner Arbeit mit mathematischen Modellen, statistischen Verfahren und der Datenhaltung und Datenmodellierung. Er wendet diese unterschiedlichen Techniken und Algorithmen auf die vorhandenen Daten an und generiert dadurch Wissen. Als Tools und Programmiersprachen kommen beispielsweise Java, Python, R oder SQL zum Einsatz.

Neben diesen technischen Fertigkeiten muss der Data Scientist die Fähigkeit besitzen, die aus den Daten gewonnenen Erkenntnisse so aufzubereiten und zu erklären, dass deren Signifikanz für das Unternehmen leicht zu verstehen ist. Er leitet auf Basis der Ergebnisse Hypothesen ab und stellt Entscheidungsvorlagen für das Management zusammen. Bei erkannten Auffälligkeiten kann der Data Scientist selbstständig die richtigen Fragestellungen formulieren. Da er als eine Art Vermittler zwischen Fachabteilungen und Management auftritt, sind gute kommunikative Eigenschaften wichtig für den Erfolg seiner Arbeit. Im Rahmen der Datenanalyse fungiert er teilweise als Projektmanager und kontrolliert oder steuert die Aufgaben von der Datenbeschaffung über die Analyse bis zur Aufbereitung der Ergebnisse.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Wie Datenanalyse im Unternehmen umgesetzt werden kann

Data Analytics

Wie Datenanalyse im Unternehmen umgesetzt werden kann

Potenziale aus Daten zu heben, steht aktuell im Fokus vieler Unternehmen – gleichzeitig stehen sie vor dem Frage, wie Datenanalyse im eigenen Unternehmen umgesetzt werden kann. Ein Überblick, was beachtet werden muss. lesen

Quo vadis KI? Die drei Wellen der Künstlichen Intelligenz

Kommentar von Oliver Rieger, The unbelievable Machine Company (*um)

Quo vadis KI? Die drei Wellen der Künstlichen Intelligenz

Künstliche Intelligenz (KI) hat das Potenzial, Geschäftsmodelle grundlegend zu verändern und Innovationen in Unternehmen zu beschleunigen. Dabei entwickeln sich die technologischen Möglichkeiten ständig weiter. Der Datenwissenschaftler Oliver Rieger (The unbelievable Machine Company, *um) schaut zurück auf die bisherige Entwicklung – und nach vorn, um zu sehen, wohin die Reise geht. lesen

Intelligente KI beginnt mit intelligenten Daten

Kommentar von Oliver Schröder, Informatica

Intelligente KI beginnt mit intelligenten Daten

Ausnahmsweise ist der Hype um eine Technologie einmal gerechtfertigt. Künstliche Intelligenz (KI) hat das Potenzial, alles zu verändern: die Art und Weise, wie wir arbeiten, wie wir leben, wie wir Entscheidungen treffen und sogar, wie wir die menschliche Natur verstehen. lesen

Data Analytics – mehr Daten, mehr Zusammenhänge, mehr Intelligenz

Kommentar von Mathias Golombek, Exasol

Data Analytics – mehr Daten, mehr Zusammenhänge, mehr Intelligenz

Immer mehr Geschäftsentscheidungen basieren auf Daten. Das ist kein neuer Trend, sondern gelebte Praxis in den Unternehmen. Doch Daten sammeln allein ist noch keine Strategie und datenbasierte Reports sind nicht mehr als der Anfang eines langen Weges zu einer Data-driven Company. Über welche Schritte sollten Unternehmen jetzt nachdenken? lesen

Databricks will Data Scientists von Routinearbeit entlasten

Apache-Spark-Projekt aus der wirtschaftlichen Perspektive

Databricks will Data Scientists von Routinearbeit entlasten

Welchen Sinn haben die Daten in den Unternehmen, wenn man sie nicht für Machine Learning nutzt? Diese rhetorische Frage stellt David Wyatt, Vice President Europe von Databricks. Als Haupttreiber des Apache-Spark-Projekts stellt das Unternehmen eine Cloud-Plattform bereit, die Data Engineers und Data Scientist zusammenbringen soll. Diese „Unified Analytics Platform“ wird derzeit um zwei Komponenten erweitert: das Projekt „Delta Lake“ zur Aufbereitung von Data Lakes und den Machine-Learning-Katalog „ML Flow“. lesen

So gelingt der Einstieg in die Data Science

Kommentar von Benjamin Aunkofer, Datanomiq

So gelingt der Einstieg in die Data Science

Big Data, Data Science und Machine Learning sind die Buzzwords dieser Jahre und Daten sind der Rohstoff für ... Lassen wir das! Wer bei BigData-Insider liest, der weiß längst, welche Rolle Daten als Rohstoff und Kapital einnehmen und wie gefragt gerade Datenexperten sind. In diesem Artikel wollen wir den Job des Data Scientists mal strukturiert durchleuchten und dann Chancen für einen Quereinstieg ausloten. Auch auf den Data Engineer gehen wir dabei ein. lesen

Was in Zukunft wichtig wird – Trends der Datenanalyse

Kommentar von Tom Becker, Alteryx

Was in Zukunft wichtig wird – Trends der Datenanalyse

Mittlerweile ist jedem klar geworden – Datenanalyse ist wichtig wie nie. Viele Unternehmen haben bereits begonnen, finanzielle und strategische Vorteile aus datenbasierten Entscheidungen zu ziehen. Kann man es sich also überhaupt noch leisten, zu warten? Welche Veränderungen sind bereits absehbar und was sind die großen Trends? lesen

Deployment von Machine Learning in die Cloud

Cloud-Storage, Entwicklungsprozesse, Auslieferung

Deployment von Machine Learning in die Cloud

Während vor wenigen Jahren Data Science in Unternehmen vor allem noch experimental war, müssen heute Entwicklungszeiten verkürzt und Vorhersagemodelle viel schneller produktiv gebracht werden. Cloud-Services wie von Google, Amazon und Microsoft helfen dabei. lesen

Zentralisiertes Datenmanagement schafft Mehrwert für Kunden

Kommentar von Dr. Ramin Beravat, TeamBank AG Nürnberg

Zentralisiertes Datenmanagement schafft Mehrwert für Kunden

Ohne Daten keine Zukunft. Das weiß auch die TeamBank. Aus diesem Grund wurden alle Weichen in Richtung digitale Zukunft gestellt. Das sogenannte „Öl des 21. Jahrhunderts“ wird in großen Mengen gesammelt und mit einer komplexen Daten-Pipeline und ebenso komplexen Algorithmen gesteuert und ausgewertet. Dieser Artikel gibt einen Überblick, wie die TeamBank mittels Machine Learning und Analytics aus Daten Mehrwert für Kunden schafft und weshalb ein zentrales Datenmanagement so wichtig ist. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44644885 / Definitionen)