Nicht nur die Menge und Verfügbarkeit von Daten, auch das Thema Datenarbeit und die Aufgaben, die sich drumherum ranken, haben sich in den letzten Jahren rasant verändert und weiterentwickelt.
Der Autor: Max Gantner ist Head of Consulting & Business Development bei Qunis
(Bild: Qunis)
Zu den Experten und Spezialisten für Business Intelligence (BI), die vor allem in den Finance-&-Controlling-Abteilungen, bei Software-Anbietern und Beratungshäusern zu finden waren und die von jeher das Thema Data Management besetzt hatten, sind mit dem unternehmensweiten Einzug von Digitalisierung, Big Data, Cloud-Services sowie der Demokratisierung von Daten neue Anforderungen und Bedarfe hinzugekommen.
Neue Aufgaben, Rollen und Berufsbilder haben sich herausgebildet und die Data Scientisten, Data Architekten und Data Engineers sind auf der Bildfläche erschienen. Allen gemein ist zunächst das Interesse an und die Arbeit mit Daten – aber was genau ist ihr Ziel, was macht sie speziell, was macht sie glücklich und mit welchen Technologien und Methoden arbeiten sie? Wie funktionieren sie zusammen und wo unterscheiden sie sich? Nachfolgend haben wir eine kleine Einordnung zusammengestellt. Diese soll helfen, die verschiedenen Disziplinen der Modern Data Worker ein wenig besser zu verstehen:
1. BI & Data Manager
BI steht für Business Intelligence und das wiederum steht für Geschäftsanalytik. Kurzum: die systematische Analyse von verfügbaren, meist in strukturierter Form vorliegender Unternehmensdaten. Ziel dabei ist es, möglichst optimale Entscheidungen für das Unternehmen treffen zu können bzw. die Entscheidungsprozesse bestmöglich mit Erkenntnissen aus Daten zu unterstützen sowie Geschäftsabläufe, Kunden- und Lieferantenbeziehungen zu verbessern.
Ein BI & Data Manager legt die Grundlage dafür, in dem verschiedenste Datenquellen angebunden und die relevanten Daten in ein Data Warehouse bzw. einen Data Lake integriert werden. Dafür müssen Schnittstellen zu den unterschiedlichen Datenquellsystemen geschaffen, Daten miteinander verknüpft und formatiert sowie schrittweise veredelt werden.
Ein weiterer zentraler Aspekt ist die Umsetzung der übergreifenden Geschäftslogik, damit die Daten am Ende auch in einer einheitlichen und vergleichbaren Form vorliegen. Dies können unterschiedlichste Logiken sein wie z. B. die Historisierung von Daten, Datenqualitätsprüfungen oder eine einheitliche Währungsumrechnung. Ein Data Manager liefert mit dem Aufbau und der Bereitstellung von logischen Datenmodellen das zentrale Fundament für darauf aufbauende Reports, Dashboards oder weiterführende Analysen.
Im Bereich des Information Designs werden die bereitgestellten Daten mit einem geeigneten Frontend-Werkzeug wie beispielsweise Excel, Power BI, Pyramid Analytics oder vergleichbaren Tools visualisiert und je nach Zielgruppe entsprechend aufbereitet. Hier spielt die Art und Weise der Darstellung eine zentrale Rolle, Standards für die Visualisierung und fokussiertes Data Storytelling sind in dieser Disziplin entscheidende Erfolgsfaktoren.
Ein BI & Data Manager liebt Daten und deren Aufbereitung bis zur passenden Visualisierung. In diesen Bereichen fühlt er sich wohl und löst so manche Knobelaufgabe, wenn es darum geht, wie man bestmöglich die Daten für Endanwender, Power User oder Analysten vorbereiten und bereitstellen kann.
2. Data Scientists
Während die BI-Welt auf sauber aufbereiteten, tabellarisch strukturierten Daten fußt, geht es in der Data-Science-Disziplin etwas wilder zu. Hier werden analytische Applikationen entwickelt, indem entsprechende Technologien wie u. a. Machine Learning oder Data-Science-Plattformen eingesetzt werden. Zudem ist ein tiefes Prozessverständnis erforderlich, damit die Anforderungen der Fachanwender an die Analyseergebnisse auch interpretiert werden können.
Vor einem Data Scientist sind auch unaufbereitete, untabellarische, unstrukturierte Daten nicht sicher: Data Scientists werten nicht nur strukturierte Tabellen aus, sondern auch Fotos, Texte, Videos und Sprachnachrichten. Dafür ist es häufig erforderlich, diese heterogenen Datenbestände vor- bzw. aufzubereiten. Um eine grundlegende Struktur in die Daten zu bekommen, nutzen sie mathematische bzw. statistische Algorithmen, Verfahren zum Clustern der Daten und zum Erkennen von Anomalien.
Data Scientists adaptieren die neuesten Verfahren zur Datenauswertung, sie arbeiten in Python und R und bauen dabei vor allem auf die Open-Source-Welt; Docker, Kubernetes, Tensorflow und github sind aus ihrem Arbeitsalltag nicht wegzudenken. Data Scientists arbeiten sehr eng mit Data Engineers zusammen. Diese kümmern sich um die gesamte Dateninfrastruktur, damit die Data Scientists ihre komplizierten Berechnungen und Datenauswertungen realisieren können.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
3. Data Architects
Bevor ein Data Engineer die Dateninfrastruktur jedoch erstellen kann, sollte ein Data Architect sie konzipieren. Das kann man sich so vorstellen wie beim Hausbau: Architekten planen hier zunächst, wie ein Haus gebaut oder umgebaut werden soll. Sie berücksichtigen dabei technische, wirtschaftliche, funktionale und gestalterische Aspekte und sind dafür zuständig, dass am Ende alles zusammenpasst und das Haus nicht einstürzt. Data Architects sind ihre Pendants in der IT-Landschaft.
Ein Data Architect ist für die Gesamtarchitektur einer Datenplattform verantwortlich – insbesondere dann, wenn komplexere Strukturen aufgebaut werden müssen. Dazu gehören die Definition und Anwendung von Architekturrichtlinien und Methoden sowie der Aufbau von Leitlinien für die Systemarchitektur und die damit verbundenen Einsatzbereiche von entsprechenden Technologien.
Diese komplexeren Strukturen fangen meist da an, wo die klassische BI-Welt aufhört – wo Big Data anfängt: dort, wo Daten in Echtzeit verarbeitet werden müssen, dort, wo unstrukturierte Daten verarbeitet werden und dort, wo hoch frequentierte Daten in kurzer Zeit verarbeitet werden. Beim Einsatz von Sensoren, die in Sekundenabständen Daten erzeugen, entstehen beispielsweise hochfrequentierte Daten. Müssen diese Daten noch in real-time – also sofort, in Echtzeit verarbeitet werden, dann erhöht sich die Komplexität zusätzlich.
Der Einsatz von Algorithmen oder anderer Analyseverfahren, wie etwa im Data-Science-Bereich, erfordert beispielsweise punktuell sehr hohe Rechenpower über einen begrenzten Zeitraum. Hier kommt dann auch die Infrastruktur mit ins Spiel, die den unterschiedlichen Anforderungen der verschiedenen Disziplinen gerecht werden muss. Die Vielfalt der technologischen Möglichkeiten, insbesondere im Cloud-Umfeld, stellen hohe Anforderungen an die Datenarchitektur. Ein Data Architect stellt sicher, dass die geforderten Anwendungsszenarien mit der angedachten Architektur und den dafür vorgesehenen Technologien umgesetzt werden können.
4. Data Engineers
Ein Data Engineer ist ein Spezialist für Datenmanagement insbesondere im Big-Data-Umfeld. Seine Arbeit umfasst die Konzeption und Implementierung von Datenintegrations- und Transformationsprozessen zur Unterstützung datengetriebener Use Cases und Data-Science-Projekte, damit eine bestmögliche Datenvorbereitung ermöglicht wird. In diesem Zusammenhang legen Data Engineers den Fokus auf die Entwicklung von analyseoptimierten Datenarchitekturen.
Data Engineers und Data Scientists arbeiten oft eng zusammen, wobei der Fokus des Data Engineers darauf liegt, Daten aus unterschiedlichsten Quellen und Formaten aufzubereiten, zu organisieren und die erforderlichen Datenpipelines aufzubauen sowie diese zu betreiben. Data Engineers arbeiten somit an der Schnittstelle zwischen Infrastruktur und Datenmanagement, überwachen Datenquellen und steuern Integrationsprozesse sowie die Instanzen, die für die Analyse und Weiterverwendung der generierten Daten zuständig sind.
In dem Sinne ist ein Data Engineer für alle Prozesse rund um das Generieren, Speichern, Pflegen, Aufbereiten, Anreichern und Weitergeben von Daten verantwortlich. Zudem ist für einen Data Engineer von hoher Bedeutung, dass die bereitgestellten Lösungen performant laufen und kontinuierlich optimiert werden. Über ein entsprechendes Monitoring hat ein Data Engineer alles im Blick.
Eng verknüpft mit Big Data, ist die Disziplin des Data Engineering noch vergleichsweise jung und stetig in der Weiterentwicklung. Data Engineers müssen sich daher stets am technischen Fortschritt orientieren, um der Entwicklung nicht hinterherzuhängen und sich in neue Frameworks, Konzepte und Technologien einarbeiten.
Damit datengetriebene Lösungen entstehen und nachhaltig funktionieren, sind weitere Rollen und Disziplinen gefordert und arbeiten mit den Modern Data Workers Hand in Hand.