Suchen

Definition Was ist Data Science?

Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Data Science ist eine angewandte, interdisziplinäre Wissenschaft. Ziel der Datenwissenschaft ist es, Wissen aus Daten zu generieren, um beispielsweise die Unternehmenssteuerung zu optimieren oder die Entscheidungsfindung zu unterstützen. Es kommen Methoden und Wissen aus verschiedenen Bereichen wie Mathematik, Statistik, Stochastik, Informatik und Branchen-Know-how zum Einsatz.

Firmen zum Thema

(Bild: © aga7ta - stock.adobe.com)

Ins Deutsche übersetzt bedeutet Data Science Datenwissenschaft. Es handelt sich um eine angewandte, interdisziplinäre Wissenschaft, die Methoden und Wissen aus zahlreichen verschiedenen Bereichen wie Mathematik, Statistik, Stochastik, Informatik und Branchen-Know-how einsetzt. Der Begriff Data Science wird bereits seit den 1960er-Jahren verwendet. Damals galt er noch als Synonym für die Informatik. Seit Beginn dieses Jahrtausend ist die Datenwissenschaft eine eigenständige Fachdisziplin.

Es existieren eigene Studiengänge für Data Science. Im Bereich der Datenwissenschaft tätige Personen werden als Data Scientists (Datenwissenschaftler) bezeichnet. Sie müssen keinen Data-Scientist-Studiengang absolviert haben, sondern es kann sich um Mathematiker, Informatiker, Programmierer, Physiker, Betriebswirtschaftler oder Statistiker handeln, die ihre Kenntnisse durch Spezialisierung auf datenwissenschaftliche Aufgaben erworben haben.

Ziel der Datenwissenschaft ist es, Wissen aus Daten zu generieren, um beispielsweise Entscheidungsprozesse zu unterstützen oder die Unternehmenssteuerung zu optimieren. Im Big-Data-Umfeld werden mithilfe der Datenwissenschaft riesige Datenmengen mit Maschinellem Lernen (ML) und Künstlicher Intelligenz (KI) analysiert. Data Science kommt in verschiedenen Branchen und Fachgebieten zum Einsatz.

Die Ziele der Datenwissenschaft

Die Ziele der Datenwissenschaft sind:

  • Wissen aus Daten zu generieren,
  • Ableitung von Handlungsempfehlungen aus Daten,
  • Unterstützung der Entscheidungsfindung,
  • Optimieren und Automatisieren von Unternehmensprozessen,
  • Unterstützung der Unternehmenssteuerung sowie
  • Prognosen erstellen und zukünftige Ereignisse vorhersagen.

Die Fachdisziplinen der Datenwissenschaft

Data Science ist eine interdisziplinäre Wissenschaft, die Wissen und Methoden verschiedener Bereiche nutzt und anwendet. Mathematik, Statistik und Stochastik bilden einen wichtigen Wissensblock. Er stellt die Grundlage dar, um Daten auszuwerten, sie zu interpretieren, Sachverhalte zu beschreiben oder Prognosen zu erstellen. Um zukünftige Ereignisse im Rahmen der Predictive Analytics vorherzusehen, kommt neben anderen statistischen Verfahren beispielsweise die induktive Statistik zum Einsatz.

Ein weiterer Wissensblock der Datenwissenschaft sind Informationstechnologie und Informatik. Die Informationstechnik stellt Verfahren und technischen Systeme zur Verfügung, um Daten zu sammeln, zu aggregieren, in Datenbanken zu speichern und zu analysieren. Wichtige Elemente in diesem Bereich sind relationale Datenbanken, Datenbankabfragesprachen wie die Structured Query Language (SQL), Programmier- und Skriptsprachen wie Python und Perl und Einiges mehr.

Neben konkreten wissenschaftlichen Kenntnissen greift Data Science auf sogenanntes Branchenwissen (Domain Knowledge oder Branchen-Know-how) zu. Dieses Wissen ist notwendig, um die Abläufe in einer bestimmten Organisation oder einem Unternehmen einer spezifischen Branche zu verstehen. Bei Domain Knowledge kann es sich beispielsweise um betriebswirtschaftliches Wissen, Logistik-Know-how oder um medizinisches Fachwissen handeln.

Big Data und die Datenwissenschaft

Aufgrund der kontinuierlichen Zunahme der anfallenden und zu verarbeitenden oder zu analysierenden Daten hat sich der Begriff Big Data etabliert. Big Data beschäftigt sich mit Methoden, Verfahren, technischen Lösungen und IT-Systemen, die die Datenflut bewältigen und große Datenmengen in der gewünschten Form verarbeiten können. Big Data ist ein wichtiger Bereich der Datenwissenschaft. Data Science liefert Wissen und Methoden, um umfangreiche strukturierte oder unstrukturierte Daten zu erheben, zu sammeln, zu speichern (zum Beispiel in eine Data Lake), mithilfe paralleler Prozesse performant zu verarbeiten und sie zu analysieren. Die Datenwissenschaft nutzt unter anderem Data Mining, Maschinelles Lernen (ML), Deep Learning (DL), Künstliche Neuronale Netze (KNN) und Künstliche Intelligenz (KI).

Was macht ein Datenwissenschaftler (Data Scientist)?

Personen, die sich mit Datenwissenschaft beschäftigen, werden als Datenwissenschaftler (Data Scientists) bezeichnet. Ihr Wissen haben Sie entweder durch das Absolvieren eines datenwissenschaftlichen Studiengangs oder durch Spezialisierung ihres Know-hows erworben. Oft handelt es sich bei Datenwissenschaftler um Informatiker, Mathematiker, Statistiker, Betriebswirtschaftler, Programmierer, Datenbank-Experten oder Physiker, die sich datenwissenschaftlich fortgebildet haben.

Neben den fachspezifischen Kenntnissen muss ein Datenwissenschaftler das aus den Daten generierte Wissen anschaulich präsentieren und verschiedenen Zielgruppen näher bringen können. Entsprechende Kommunikations- und Präsentationsfähigkeiten sind notwendig. Gegenüber der Geschäftsführung oder dem Management eines Unternehmens haben sie beratende Funktion. Im unternehmerischen Umfeld kommt es häufig zu einer Vermischung der Bezeichnungen Data Scientist, Business Analyst oder Data Analyst. Teilweise überschneiden sich ihre Aufgaben und Tätigkeitsbereiche.

Während der Data Analyst klassische praktische Datenanalyse betreibt, verfolgt der Data Scientist einen mehr wissenschaftlichen Ansatz mit ausgefeilten Methoden, beispielsweise der Künstlichen Intelligenz oder des Machine Learnings und fortgeschrittenen Analyse- und Vorhersagetechniken. Gegenüber dem Business Analyst grenzt sich der Datenwissenschaftler ab, indem der Tätigkeitsschwerpunkt nicht rein in der Analyse von Geschäftsmodellen und Geschäftsprozessen liegt. Business-Analysten nutzen für ihre Analysen die von den Datenwissenschaftlern aufbereiteten Daten und die von ihnen bereitgestellten Datenmodelle und Tools wie interaktive Dashboards oder KPIs.

Anwendungsgebiete der Datenwissenschaft

Den Anwendungsmöglichkeiten der Datenwissenschaft sind kaum Grenzen gesetzt. Überall dort, wo große Datenmengen anfallen und auf Basis der Daten Entscheidungen getroffen werden müssen, ist der Einsatz von datenwissenschaftlichen Methoden sinnvoll. Typische Branchen und Fachbereiche, in denen die Datenwissenschaft von großer Bedeutung ist, sind das Gesundheitswesen, die Logistik, der Online-Handel und der stationäre Handel, die Versicherungsbranche, das Finanzwesen, die Industrie und die Produktion.

(ID:46985273)

Über den Autor