Definition

Was ist ein Data Scientist?

| Autor / Redakteur: Tutanch / Nico Litzel

(© aga7ta - Fotolia)

Ein Data Scientist wertet Daten systematisch aus und extrahiert Wissen. Auf Basis der gewonnenen Erkenntnisse unterstützt er die Unternehmensführung bei strategischen Entscheidungen. Data Scientists bewegen sich oft im Umfeld von Business Intelligence und Big Data.

Der Begriff Data Scientist lässt sich mit Datenwissenschaftler übersetzen. Es handelt sich um eine Berufsbezeichnung für eine Person, die über entsprechende Kenntnisse und Fähigkeiten verfügt, große Datenmengen systematisch auszuwerten und Wissen aus den Daten abzuleiten. Hierfür nutzt der Data Scientist praktische Methoden und theoretische Ansätze aus verschiedenen Wissenschaften wie der Informationstechnik und der Mathematik, speziell hier die Statistik oder die Wahrscheinlichkeitsrechnung.

Neben diesen fachlichen Fähigkeiten muss ein Data Scientist in der Lage sein, die gewonnenen Erkenntnisse anschaulich zu präsentieren und sie Dritten ohne spezifische Fachkenntnisse zu vermitteln. Er tritt gegenüber der Unternehmensführung in beratender Funktion auf und unterstützt diese bei strategischen Unternehmensentscheidungen.

Als Datengrundlage dienen dem Data Scientist sowohl strukturiert als auch unstrukturiert vorliegende Daten. Oft kommen bei der Datenanalyse Big-Data-Techniken zum Einsatz. Die Datenanalyse führt er entweder selbst durch oder er unterstützt IT-Spezialisten bei der Analyse beziehungsweise leitet sie an. Er kann auch als Projektleiter auftreten, der die verschiedenen Aufgaben und Tätigkeiten der Datenauswertung steuert und kontrolliert. Zunehmende Datenmengen im Unternehmen und der Fortschritt in den verschiedenen Big-Data-Bereichen lassen die Position des Data Scientists an Bedeutung gewinnen.

Unterscheidung zwischen Data Scientist, Data Analyst und Business Analyst

Oft kommt es zu einer Vermischung der Bezeichnungen Data Scientist, Data Analyst und Business Analyst. Die Begriffe lassen sich zwar nicht exakt voneinander abgrenzen und verschmelzen in einigen Teilbereichen miteinander, können aber dennoch in ihren grundsätzlichen Tätigkeitsfeldern unterschieden werden. Der Data Analyst betreibt klassische Datenanalyse, verfolgt aber keinen wissenschaftlichen Ansatz. Methoden der Künstlichen Intelligenz oder des Machine Learnings und weitere fortgeschrittene Analyse- und Vorhersagetechniken nutzt er nur in beschränktem Maße.

Ein Data Scientist ist in der Lage, innovative Methoden für seine Analysen zu nutzen und besitzt einen akademisch erweiterten Hintergrund. Die Fähigkeit, über den Tellerrand der reinen Datenanalyse zu schauen, zeichnet ihn aus. Business-Analysten können sich zwar auch mit der Datenanalyse beschäftigen oder sie durchführen, haben ihren Schwerpunkt aber mehr in der Analyse der Geschäftsmodelle und Geschäftserlöse. Sie werten Geschäftsmodelle IT-gestützt aus und nutzen zentrale KPIs und Werkzeuge wie Dashboards für ihre Arbeit.

Wichtige Eigenschaften und Fähigkeiten des Data Scientists

Ein Data Scientist beschäftigt sich mit unterschiedlichen Wissenschaftsbereichen und kann daher verschiedene akademische Hintergründe haben. Data Scientists können Informatiker, Physiker, Mathematiker oder Wirtschaftswissenschaftler sein, die sich entsprechende fortgebildet haben.

Mittlerweile existieren eigene Data-Science-Bachelor- oder -Master-Studiengänge, in denen alle wichtigen und benötigten Wissensgebiete vermittelt werden. Die Basis der Fähigkeiten eines Data Scientists bilden fachliche Kenntnisse aus den Bereichen der Statistik, der Mathematik, der Wahrscheinlichkeitsrechnung und der IT. Hinzu kommen die Methoden des Machine Learnings, der künstlichen Intelligenz und der Prognostik. Der Data Scientist befasst sich bei seiner Arbeit mit mathematischen Modellen, statistischen Verfahren und der Datenhaltung und Datenmodellierung. Er wendet diese unterschiedlichen Techniken und Algorithmen auf die vorhandenen Daten an und generiert dadurch Wissen. Als Tools und Programmiersprachen kommen beispielsweise Java, Python, R oder SQL zum Einsatz.

Neben diesen technischen Fertigkeiten muss der Data Scientist die Fähigkeit besitzen, die aus den Daten gewonnenen Erkenntnisse so aufzubereiten und zu erklären, dass deren Signifikanz für das Unternehmen leicht zu verstehen ist. Er leitet auf Basis der Ergebnisse Hypothesen ab und stellt Entscheidungsvorlagen für das Management zusammen. Bei erkannten Auffälligkeiten kann der Data Scientist selbstständig die richtigen Fragestellungen formulieren. Da er als eine Art Vermittler zwischen Fachabteilungen und Management auftritt, sind gute kommunikative Eigenschaften wichtig für den Erfolg seiner Arbeit. Im Rahmen der Datenanalyse fungiert er teilweise als Projektmanager und kontrolliert oder steuert die Aufgaben von der Datenbeschaffung über die Analyse bis zur Aufbereitung der Ergebnisse.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Die Frage der Künstlichen Intelligenz und der Ethik

Kommentar von Lynn Heidmann, Dataiku

Die Frage der Künstlichen Intelligenz und der Ethik

Es ist die dystopische Kulisse eines jeden Science-Fiction-Romans, welcher sich mit dem Thema der Künstlichen Intelligenz befasst: ein dunkler und stürmischer Polizeistaat, in dem kalte, gefühllose Roboter auf der Suche nach fehlerhaften Menschen sind. Während wir bei Dataiku optimistisch sind, dass wir ein wenig von dieser trostlosen Zukunft entfernt sind, war 2018 ein Jahr voll mit ethischen Fragen über die Auswirkungen von Künstlicher Intelligenz auf unser Leben. lesen

So klappt’s mit Microsoft Power BI

Business Intelligence mit Microsoft

So klappt’s mit Microsoft Power BI

Power BI gilt als eines der vielversprechendsten BI-Tools, doch viele Unternehmen tun sich schwer damit, den Self-Service-Ansatz, den Microsoft verfolgt, mit Governance und Reporting in Einklang zu bringen. Dieser Artikel soll einen Weg aufzeigen, wie Power BI erfolgreich eingeführt werden kann. lesen

Microsoft stellt Azure Cognitive Services bereit

Container-basiertes Machine Learning

Microsoft stellt Azure Cognitive Services bereit

Der Einsatz von Machine Learning erfordert in der Regel einen Data Scientist. Mit den Container-basierten Azure Cognitive Services will Microsoft aber auch Entwickler in die Lage versetzen, ihre Anwendungen mithilfe maschinellen Lernens zu verbessern. lesen

Sicherheit durch intelligente Analytics-Anwendungen

Künstliche Intelligenz und Machine Learning

Sicherheit durch intelligente Analytics-Anwendungen

Wenn nachts die Alarmanlage unseres Autos losheult, sind wir in Nullkommanichts auf den Beinen. Oft genug ist es falscher Alarm, aber deswegen werden wir ihn noch lange nicht ignorieren. Auch IT-Systeme sind sich oft nicht sicher, ob sie tatsächlich bedroht werden. Analytics-Systeme mit selbstlernenden Funktionen helfen ihnen bei der Entscheidung. lesen

Data Management über verteilte Landschaften

Kommentar von Timo Kubach & Christian Mathis, SAP

Data Management über verteilte Landschaften

Das Volumen relevanter Unternehmensdaten wächst exponentiell und soll laut einer Studie von IDC aus dem Jahr 2017 bis 2025 158 Zettabyte erreichen. Diese explosionsartige Zunahme an zumeist unstrukturierten Daten (IoT, Bilder, soziale Netzwerke) entfesselt neue Innovationspotenziale für Unternehmen. lesen

Wie Unternehmen Data Science für sich nutzen können

Die Arbeit eines Data Scientist

Wie Unternehmen Data Science für sich nutzen können

Ob von Menschen oder Maschinen: Heutzutage werden alle Daten gesammelt. Der Umfang und die Vielfalt der erfassten Daten sind enorm. Solche Daten können wie „Goldnuggets“ sein: In ihnen stecken Informationen, die Geschäftsentscheidungen beeinflussen können. Es sind Experten gefragt, die aus den Daten die entscheidenden Informationen extrahieren, um genau dieses Potenzial zu erforschen. lesen

Microstrategy stellt das „Intelligent Enterprise“ vor

Nachbericht Microstrategy Symposium München

Microstrategy stellt das „Intelligent Enterprise“ vor

„Intelligent Enterprise“ ist eines der Konzepte, das der BI-Spezialist Microstrategy kürzlich auf einem Symposium in München seinen Kunden präsentierte. Der Begriff umfasst u. a. Cloud, Mobile, allgegenwärtige Daten, Machine Learning und natürliche Sprache. lesen

Data Lab als Bindeglied zwischen Corporate BI und Business

Bimodale BI im DAX-Konzern

Data Lab als Bindeglied zwischen Corporate BI und Business

Weltweit sehen sich Unternehmen mit der Herausforderung konfrontiert, klassische BI-Lösungen und agile Self-Service-Ansätze unter einem Dach zu vereinen – kein einfaches Unterfangen, stehen sich hier doch vollkommen unterschiedliche Denk- und Vorgehensweisen gegenüber. Ein großer deutscher Konzern hat diese Aufgabenstellung mit Hilfe eine Data Labs gelöst, das als eigenständige Abteilung zwischen Corporate BI und Fachabteilungen angesiedelt ist. lesen

Teradata Vantage – Analyse ohne Tool- und Sprachgrenzen

Neue Plattform integriert QueryGrid

Teradata Vantage – Analyse ohne Tool- und Sprachgrenzen

Unter der Bezeichnung „Vantage“ hat die Teradata Corp. ein „Ökosystem“ auf den Markt gebracht, das Datenanalysen über heterogene Systeme ermöglichen soll, ohne dass der Anwender zu tief in die Technik einsteigen muss. Die Produkte QueryGrid und 4D Analytics sind darin integriert. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44644885 / Definitionen)