Kommentar von Oliver Schröder, Informatica

Vier Schritte, um Data Lakes zu strukturieren

| Autor / Redakteur: Oliver Schröder / Nico Litzel

Der Autor: Oliver Schröder ist Geschäftsführer DACH, Informatica
Der Autor: Oliver Schröder ist Geschäftsführer DACH, Informatica (Bild: Informatica)

IT-Mitarbeiter stehen vor einer Reihe von Herausforderungen. Sie müssen nicht nur immer mehr Services anbieten, sondern auch neue Technologien implementieren. Darüber hinaus müssen sie sich jetzt auch noch des Themas Kundenzufriedenheit annehmen. Denn unzufriedene Kunden beeinflussen das gesamte Unternehmen.

Unternehmen sollten feststellen, was Kunden möchten und ihnen ein herausragendes Erlebnis über alle Kanäle hinweg bieten – basierend auf Daten, die aus Dutzenden von Geschäftssystemen und Anwendungen generiert werden. Dazu gehören Beschaffung, Callcenter-Interaktionen, Website-Besuche, mobile App-Nutzung und zunehmend IoT-Sensoren und -Geräte. Auf den ersten Blick scheint die Lösung einfach zu sein: Alle Daten in einen Data Lake fließen und von Data Scientists und Business-Analysten analysieren zu lassen. Dadurch ergeben sich neue Erkenntnisse, die in Aktivitäten umgesetzt werden können und die zu einem individuelleren, personalisierten Kundenerlebnis führen. Aber der Prozess verläuft selten reibungslos.

Ein Problem ist, dass die Daten in vielfältigen Formen und großen Mengen vorliegen und nicht sofort einsatzbereit sind. Die Daten für die moderne Analytik vorzubereiten ist komplex und verschärft das Problem. Eine weitere Herausforderung: Die Daten wachsen exponentiell und in Echtzeit weiter. Deswegen verbringen Data Scientists zu viel Zeit mit der Bereinigung und Aufbereitung von Daten anstatt mit Mehrwertanalysen und strategischen Entscheidungen. Diese Situation ist nicht nachhaltig und kostet Unternehmen bares Geld. Viele Organisationen erkennen, dass sie in ihrem Eifer und der Eile, einen Data Lake zu implementieren, eher einen „Datensumpf“ geschaffen haben, der für sie zum Alptraum wird. Warum? Sie haben einen kritischen Erfolgsfaktor übersehen: Data Governance. Diese bringt Menschen, Richtlinien, Prozesse und Technologien zusammen und ist erforderlich, um den bestehenden Datenschatz in einen kristallklaren Data Lake zu verwandeln – der dann ein vertrauenswürdiger und wertvoller Unternehmenswert wird.

Was ist Data Governance genau?

Data Governance ist das Management von Praktiken und Prozessen, die die Qualität, Verfügbarkeit, Benutzerfreundlichkeit, Integrität und Sicherheit von Unternehmensdaten gewährleisten – und zwar on-premises wie auch in der Cloud. Unterstützt wird sie von einem umfangreichen Technologie-Stack, der Komponenten für Geschäftsglossarien, Richtliniendefinition und Zusammenarbeit, Datenablage, Datenintegration, Datenqualität, Metadatenmanagement, Sicherheit und Datenschutz, Datenmaskierung und Datenkatalogisierung bietet. So lassen sich Informationen klassifizieren, Beziehungen identifizieren und End-Usern Suchanfragen nach Daten durch einen Katalog ermöglichen. Auch wenn dies nach viel klingt: In Kombination mit Künstlicher Intelligenz (KI) und der richtigen Technologielösung erhalten Unternehmen einen automatisierten Ansatz für die Data Governance mit vertrauenswürdigen, kontextbezogenen und zugänglichen Daten.

Obwohl die richtige technologische Grundlage entscheidend ist, erfordert Data Governance auch die Zusammenarbeit mit einer Reihe von Stakeholdern. Dazu gehören Chief Data Officers, Enterprise Architects, Business Unit Leads und Data Stewards, die für die Kontrolle der Datenqualität, die Einhaltung von Datenrichtlinien und -prozessen sowie die täglichen Governance-Aktivitäten verantwortlich sind. Die Leiter der einzelnen Business Units müssen eng mit den IT-Teams zusammenarbeiten, um die Rollen und Ziele des jeweils anderen zu verstehen. Ansonsten laufen sie Gefahr, dass Data-Governance-Richtlinien und -Prozesse nicht umgesetzt werden. Data Governance ist bei den effektivsten Programmen ein Teil der Unternehmenskultur. Es ist keine eigenständige Disziplin, sondern die Art und Weise, wie das Geschäft geführt wird.

Vier Schritte zur Data Governance für Big Data

Die folgenden vier Schritte helfen Unternehmen dabei, das enorme Potenzial von Data Lakes zu erkennen und damit die Aktivitäten im gesamten Unternehmen voranzutreiben – sei es, um eine höhere Kundenzufriedenheit zu unterstützen, Betrug zu erkennen, Risiken zu managen, effizienter zu sein oder andere Geschäftsziele zu erreichen.

  • 1. Ordnung in das Daten-Chaos bringen: Unternehmen sollten eine Data-Governance-Strategie verfolgen. Nur so lässt sich gewährleiten, dass Informationen über Daten und Systeme gut organisiert, klassifiziert und katalogisiert sowie in einer gemeinsamen „Sprache“ beschrieben sind. So verstehen Anwender die Bedeutung, den Kontext und die Relevanz von Daten deutlich besser. Gleichzeitig lässt sich so das Chaos roher, strukturierter sowie unstrukturierter Informationen in einem Data Lake beseitigen.
  • 2. Datenanalyse vorbereiten: Die Datenqualität sollte ein wichtiger Bestandteil des Data-Governance-Programms sein, denn dadurch lässt sich gewährleisten, dass Informationen konsistent, akkurat, vertrauenswürdig und für Analysen geeignet sind. Data-Governance-Bemühungen sollten auch dazu beitragen, dass nur autorisierte Mitarbeiter auf entsprechende Daten zugreifen können. Darüber hinaus müssen sie den gesetzlichen Anforderungen entsprechen, insbesondere hinsichtlich des Datenschutzes.
  • 3. Self-Service ermöglichen: Business-User und Data Scientists benötigen Self-Service Tools und semantische Suchfunktionen, um einfach und problemlos nach Daten zu „suchen“ (ähnlich der Produktsuche auf einer Retail-Website). Sie könnten dann außerdem eine facettierte Suche anwenden, um die Ergebnisse zu verfeinern. Die Datenverantwortlichen innerhalb einer Organisation werden nur dann Daten unternehmensweit zur Verfügung stellen, wenn gewährleistet ist, dass sie Richtlinien und Branchenvorschriften erfüllen. Nur dann lassen sich Daten „demokratisieren“. Firmen erhalten eine Vielzahl von Vorteilen, wenn Data Lakes demokratisiert und Informationen besser nutzbar sind.
  • 4. Katalysator für datengesteuerte Geschäftswerte sein: Unternehmen können Data Governance als Katalysator nutzen, um die digitale Transformation zu beschleunigen. Vertrauenswürdige, nutzbare Informationen eines Data Lakes unterstützen Organisationen dabei, Effizienzen zu finden, komplexe Prozesse zu vereinfachen, Innovationen zu fördern, Wettbewerbsvorteile zu schaffen und Datenschutzanforderungen wie die Datenschutzgrundverordnung (DSGVO) einzuhalten

Kristallklare Data Lakes benötigen Data Governance

Ein Data Lake soll ein einziges, vertrauenswürdiges Repository für historische und Echtzeit-Informationen sein. Unternehmen sind damit in der Lage, intelligentere und schnellere Entscheidungen zu treffen. Data Governance ist entscheidend dafür, dass Daten konsistent, genau, kontextualisiert, zugänglich und geschützt sind. Ein kristallklarer „Datensee“ ermöglicht Unternehmen von ihren umfangreichen Daten zu profitieren. Damit können sie innovative Produkte und Dienstleistungen anbieten, Kunden besser bedienen und höhere Geschäftswerte im digitalen Zeitalter schaffen.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 46059672 / Data Sourcing)