Der Modern Data Stack und die neue Rolle des Analytics Engineers

Kommentar von Michael Krause, ThoughtSpot Der Modern Data Stack und die neue Rolle des Analytics Engineers

26.01.2022 Von Michael Krause

Anbieter zum Thema

fsas-afc-horizontal-2-positive-rgb-nov24 (Fsas)

Fujitsu Technology Solutions GmbH

QUNIS GmbH

Fivetran Germany GmbH

Der Modern Data Stack hat nicht nur den Analyseprozess gewandelt, sondern auch die Rollen und Verantwortlichkeiten der beteiligten Datenexperten verändert und Platz für eine neue Rolle geschaffen: den Analytics Engineer.

Der Autor: Michael Krause ist Customer Success Manager bei ThoughtSpot(Bild: ThoughtSpot) — Der Autor: Michael Krause ist Customer Success Manager bei ThoughtSpot
(Bild: ThoughtSpot)

In der Regel legen die Datenanalysten und Data Engineers das Fundament für den Aufbau datengesteuerter Organisationen. Sie liefern die Fakten, die zur Verbesserung von Produkten, Prozessen und Dienstleistungen durch Analysen benötigt werden. Die Datenanalysten sorgen dafür, dass die in den Daten verborgenen Erkenntnisse gewonnen werden, indem sie Fragen beantworten wie „Warum ist die Kundenabwanderung im letzten Monat so signifikant angestiegen?“ oder „Welches sind die besten Vertriebskanäle?“. Sie arbeiten eng mit den Geschäftsanwendern zusammen, um deren Datenanforderungen sowie die Art der gesuchten Erkenntnisse zu verstehen und diese in geschäftskritischen Dashboards zu konsolidieren. Auch jede Art von Prognosen fällt für gewöhnlich in ihren Zuständigkeitsbereich.

Am anderen Ende der Datenpipeline bauen Data Engineers Kundendatenintegrationen auf, verwalten die Orchestrierung der Datenpipeline, entwickeln und implementieren Endpunkte für Machine Learning. Sie bauen und warten nicht nur die Datenplattform, sondern arbeiten auch an der Optimierung der Leistung des Data Warehouses oder Data Lakes.

Diese beiden Rollen sowie der Data Scientist für fortgeschrittene Analysen und Prognosen reichten mehr oder weniger aus, um den Analyseprozess in der sich langsam entwickelnden, starren Welt der On-premises-Technologie zu verwalten. Doch mit dem Wechsel in die Cloud verändern sich der Data Stack, seine Komponenten und Prozesse dramatisch.

Der Modern Data Stack

Der Modern Data Stack ist in der Cloud verwurzelt. Im Mittelpunkt steht eine Cloud-basierte Datenplattform zur Speicherung von Daten wie Snowflake, Amazon Redshift oder Google BigQuery, um nur einige zu nennen. Neue Tools wie Fivetran oder Stitch haben den Prozess der Datenaufnahme automatisiert, um zuverlässig abfragefertige Daten aus allen verschiedenen Quellen in das Cloud Data Warehouse zu liefern. Transformationstools wie dbt oder Supergrain helfen dann bei der Umwandlung der in das Warehouse geladenen Daten. In dieser Cloud-Umgebung, in der die Geschwindigkeit und der Umfang der Daten eine wichtige Rolle spielen, ist der ETL-Prozess häufiger ein ELT-Prozess (Extract, Load, Transform).

Diese Geschwindigkeit und der Umfang der Cloud-Daten erfordern auch neue, Cloud-basierte Analysetools, die idealerweise direkt mit der Cloud-basierten Datenplattform verbunden und in denen Analysen direkt durchgeführt werden können. Aufgrund des Volumens der Cloud-Daten müssen die Analyselösungen eine einfache und schnelle Möglichkeit bieten, auf granularer Ebene auf Daten zuzugreifen, zum Beispiel mithilfe von Suchtechnologien. Außerdem helfen Technologien wie KI und Machine Learning dabei, die relevanten Daten zu finden sowie zu erkennen, was neu ist und was sich geändert hat. Andernfalls bleiben wichtige Erkenntnisse in den Datenbergen der Cloud-Datenplattform verborgen. Der Analyseprozess sollte nicht bei der Analyse aufhören. Ebenso wichtig ist es, die Erkenntnisse in die Anwendungen zurückzuspielen, aus denen die Daten stammen, um schnelle Handlungsaufforderungen zu ermöglichen. Hier ist ein umgekehrter ETL-/ELT-Prozess erforderlich.

Dieser Modern Data Stack ist jedoch nicht in Stein gemeißelt, sondern entwickelt sich ständig weiter. Und diese Veränderungen betreffen nicht nur die Datenprozesse, sondern auch die damit verbundenen Aufgaben und Rollen der Datenexperten. An der Schnittstelle zwischen den Datenanalysten und den Data Engineers hat sich eine neue Rolle herauskristallisiert: die des Analytics Engineers.

Vorstellung der Analytics Engineers

Wie Anna Filippova, Director of Community bei dbt Labs, auf unserer jährlichen Benutzerkonferenz Beyond sagte, bedeutet die Rolle der Analytics Engineers nicht nur eine Verschmelzung der Rollen von Datenanalysten und Data Engineers. Sie erklärte: „Als Analyst ist man hauptsächlich damit beschäftigt, schnell eine Antwort zu finden. Es ist in Ordnung, Code zu schreiben oder zu optimieren, um zu dieser Antwort zu gelangen, aber weniger interessant ist das Refactoring und die Skalierung. Data Engineers hingegen löschen die meiste Zeit Brände auf der Datenplattform. Sie sorgen dafür, dass die Daten, wie erwartet, pünktlich geladen werden. Es ist schwer, die für die Datenmodellierung erforderliche tiefgreifende Arbeit zu priorisieren und gleichzeitig dafür zu sorgen, dass die Dinge nicht zusammenbrechen.“

Sie wies darauf hin, dass diese Lücke zwischen den beiden Teams der Ausgangspunkt für Analytics Engineering war, mit dem Ziel, die regelmäßigen Aufgaben der Analysten zu abstrahieren und über ihre Wiederverwendbarkeit nachzudenken.

Vereinfacht kann man sagen, dass innerhalb des Modern Data Stack die Analytics Engineers dafür verantwortlich sind, saubere, transformierte Daten bereitzustellen, die von den Geschäftsanwendern an der Front analysiert werden können. Wie machen sie das? Indem sie technische Methoden wie Versionskontrolle, Tests und kontinuierliche Integration auf den Analysecode anwenden. Sie pflegen die Datendokumentation und -definitionen und schulen ihr Team in der Verwendung moderner Analysetools.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Eine weitere wichtige Veränderung in der Rolle des Analysten ist die Ausweitung der Zuständigkeiten. Analytics Engineers werden zunehmend damit beauftragt, Daten zu organisieren und umzuwandeln, um sie für andere Systeme und Personen einfach nutzbar zu machen. Mit der Ausweitung der Zuständigkeiten steigt auch der Bedarf an erweiterten Fähigkeiten und Fertigkeiten. Analytics Engineers werden zu Experten für Dokumentation, Automatisierung, Analyse und Visualisierung. Sie bilden sich weiter. Sie verdoppeln ihre SQL-Kenntnisse und fügen neue Sprachen wie Python und neue Tools wie dbt hinzu, um ihren Teams mehr Nutzen zu bieten.

Warum das Lernen von Kollegen und Kolleginnen wichtiger denn je ist

So wie sich der Modern Data Stack weiterentwickelt, so entwickeln sich auch die Rollen und ihre Zuständigkeiten. Wie Anna Filippova feststellte, „stehen wir wirklich erst am Anfang der Reise all der verschiedenen Dinge, die Menschen mit dem Modern Data Stack tun können. Wir sind also noch nicht damit fertig, herauszufinden, welche Tools wir verwenden sollten, wer welche Aufgaben übernehmen sollte, wer wem unterstellt ist oder welche Karrierewege jemand einschlagen sollte.“

Diese kontinuierliche Entwicklung macht es denjenigen schwer, die Pionierarbeit in diesen neuen Rollen leisten. Hier kann es sehr hilfreich sein, sich mit Fachkollegen und -kolleginnen auszutauschen und zu vergleichen, wie sie ihre Arbeit machen, welche Tools sie verwenden, wie ihre Organisation strukturiert ist und wie sie bewährte Verfahren und Erfahrungen austauschen. Es lohnt sich. Der Modern Data Stack erlaubt, dynamische Analysefunktionen bereitzustellen, die mit traditionellen Data Warehouses und Data Lakes nicht möglich waren. Das sind aufregende Zeiten für Datenexperten, ganz gleich, in welcher Rolle sie tätig sind.

Artikelfiles und Artikellinks

Link: ThoughtSpot im Web

(ID:47930753)