Kommentar von Tom Becker, Alteryx

Self-Service Data Preparation und ETL

| Autor / Redakteur: Tom Becker / Nico Litzel

Der Autor: Tom Becker ist Direktor DACH bei Alteryx
Der Autor: Tom Becker ist Direktor DACH bei Alteryx (Bild: Alteryx)

Das Business Application Research Center (BARC) hat „Self-Service Data Preparation“ als ein Hot Topic für 2017 ausgewiesen. Aber ist das wirklich eine neue Softwarekategorie? Was unterscheidet sie von herkömmlichen ETL-Werkzeugen?

Ähnlich wie vor zehn Jahren, als mit Tableau und QlikView moderne Werkzeuge den BI-Markt aufgerollt haben, gibt es auch bei der Datenanalyse und -aufbereitung einen Paradigmenwechsel. So wie heute in allen größeren Unternehmen Self-Service-BI-Lösungen im Einsatz sind, so verschieben sich auch immer mehr Datenaufbereitungsprozesse von der IT in den Fachbereich. Und damit sind wir auch schon bei der Hauptunterscheidung zu ETL-Werkzeugen.

1. Self-Service bedeutet Fachbereich

Fachbereiche haben schon immer versucht, notwendige Daten eigenständig aufzubereiten, sei es mit Excel und Access oder als Teil der modernen BI-Plattformen. Niemand würde dabei von ETL sprechen, das ist der IT vorbehalten, diese kennt sich mit SQL und anderen Programmiersprachen aus. Zudem besteht der Fokus der IT darin, Governance und Datenqualität sicherzustellen, der Fachbereich möchte sich in der Regel eher auf die Businessfragen konzentrieren. Er ist froh, wenn er dazu einen SVERWEIS anwenden kann. Da aber durchschnittlich fünf Datenquellen für Analysen notwendig sind, kann dabei viel manueller Aufwand entstehen.

2. Businessfragen gehören dem Fachbereich

Die Natur von Businessfragen ist, dass sie im Fachbereich entstehen. Erst die Datenverarbeitung innerhalb der IT führt dazu, dass die Fragen übersetzt werden müssen, um in einem IT Prozess abgebildet zu werden. Daher versucht ein ETL Prozess diese Transformationen generisch durchzuführen. Self-Serviceservice Data Preparation dagegen ist idealerweise ein Prozessschritt innerhalb der Datenanalyse des Fachbereichs. Damit kehrt ein Stück Autonomie in den Fachbereich zurück. Diese neue Kategorie ersetzt auch kein ETL, sondern ergänzt es und ermöglicht das Einbinden von weiteren Daten, was uns zum nächsten Thema führt.

3. Gebt mir alle Daten dieser Welt

Natürlich ist es theoretisch möglich, auch mit ETL-Werkzeugen immer mehr Datenquellen einzubinden und in eine Zieldatenbank zu schreiben, aber warum sollte ich das tun? Datenstrukturen werden immer komplexer, die Mengen immer größer, sodass ich nicht alle Daten dieser Welt vorab extrahieren und transformieren, sondern nur die relevanten Daten einbinden möchte. Und bei den Big-Data- und Data-Lake-Projekten ist auch nicht die Vereinigung aller Daten Ziel der Übung, sondern die umfassende Speicherung der Rohdaten.

Durch die Verfügbarkeit von Open Data ergeben sich außerdem weitere Chancen für Analysen im Fachbereich, die sicher nicht Teil eines IT-getriebenen ETL-Prozesses sind. All diese Punkte führen dazu, dass Self-Service Data Preparation die Relevanz und Aktualität von Analysen erhöht.

4. Von einem der auszog, um zu analysieren

Datenaufbereitung ist kein Selbstzweck – die Analyse der Daten steht im Mittelpunkt des Fachbereichs. Und das umfasst mehr als nur die Abbildung der Vergangenheit, sondern soll idealerweise Entscheidungen vorbereiten bzw. Handlungsempfehlungen geben. Diese weiterführende Analysen sind kein Bestandteil von ETL-Tools, obwohl sie inhaltlich zusammenhängen. In einer Self-Service-Datenanalyse-Plattform wird diesem Zusammenhang Rechnung getragen – damit schließt sich der Kreis zwischen Frage und Antwort.

Jedes Jahr werden alte Themen gefunden und als Neuigkeiten durch das Dorf getrieben – Self-Service Data Preparation ist keins davon. Es ist neuer Wein, der nicht in alte Schläuche gehört.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 44578990 / Analytics)