Was ist ein Data Lake?



  • Beim Data Lake handelt es sich um einen sehr großen Datenspeicher, der die Daten aus den unterschiedlichsten Quellen in ihrem Rohformat aufnimmt. Er kann sowohl unstrukturierte als auch strukturierte Daten enthalten und lässt sich für Big-Data-Analysen einsetzen.

    Klicken sie hier um den Artikel zu lesen



  • Die Frage, die sich mir stellt: Die Aufbereitung der Daten in einem Data Warehouse zur Analyse ist ja nun mal sinnvoll um Daten aus verschiedenen Transaktionen/Prozessen etc. zusammenzuführen und sinnvolle Analysen durchzuführen. Diese Arbeit fällt beim Data Lake ja nicht einfach weg, wird allerdings erst bei der Abfrage fällig. Mag ein Vorteil sein für fähige Unternehmen mit fähigen Data Sciencist wie Google etc. bei anderen Unternehmen scheint mir dieses Konzept doch eher Komplexitätserhöhend und damit wenig zielführend. Was sagen sie?



  • @Jan (nicht registrierter User) - Ich denke die Komplexität bleibt gleich. Der Unterschied ist einfach, dass man erstmal alle Daten sammelt und dann "on a demand basis" die tatsächliche Interpretation und Zusammenführung von Daten vornimmt. Wer diese Aufgabe inHouse nicht erledigen kann, muss sie dann eben auslagern - wie beim Data Warehouse auch. Die Arbeitsschritte (Datensammlung und Interpretation) sind die gleichen - nur werden sie beim DataLake zeitlich voneinander getrennt was m.E. ein Vorteil ist.



  • Der Unterschied ist dass ein DWH Fragen beantworten kann welche heute gestellt werden aufgrund von Daten welche in den aktuell betriebenen Systemen (ERP usw) vorhanden sind.

    DataLake ermöglicht Fragen und Szenarien zu beantworten welche sich zukünftig auftun, sei es wegen geänderter gesetzlicher Vorgaben, wegen veränderter wirtschaftlicher Rahmenbedingungen, neue Ideen der Unternehmensführung usw.

    Es ist aber in beiden Fällen unerheblich ob das KnowHow für ETL / Reporting aus Eigenleistung erbracht oder durch Beratungsunternehmen erbracht wird. Der Punkt ist dass im Fall eines vorhandenen DataLakes mutmasslich die auszuwertende Datenbasis wesentlich mehr Möglichkeiten bietet.
     



  • Ein DataLake bietet sicher wesentlich mehr Möglichkeiten für Zukunftsforscher und Propheten....wenn Sie das entsprechende Know How mitbringen oder es bezahlen können....Wenn ein Mittelständisches Unternehmen einfach nur seinen Planungsprozess verkürzen, die Zeit für die Aufbreitung des Standardisierten Monatlichen Reportings verkürzen und effektiver gestalten will, klassische Kennzahlenauswertung betreiben möchte....dann hat da ein DataLake nichts zu bieten...Dennoch wird das permanent so vermengt, dass man auch bei solchen Unternehmen mit entsprechender Fragestellung konfrontiert wird...nur weil es in jeder Munde ist



  • DataLake ist, wenn es sich nicht gerade wirklich um unstrukturiertes BigData á la Amazon und Google handelt, nur ein Facelift alter Zustände in Unternehmen, wo Unser mit eigenen Select Statements sich die Daten zusammengesucht haben. Da habe ich mal einen treffenden Satz aus einer Fachabteilung gehört: "wir ertrinken in Daten und dürsten nach Information" ... 


Log in to reply