Suchen

E-Book von BigData-Insider Big-Data-Datenbanken

| Autor / Redakteur: Michael Matzer / Nico Litzel

Big-Data-Datenbanken sollen die unterschiedlichsten Datentypen schnell und effizient verarbeiten. Sie lösen die herkömmlichen, überwiegend relationalen Datenbanktypen ab, die meist ein Data Warehouse unterstützen. Sie lösen sie ab, um neue Geschäftsmodelle zu ermöglichen, oder sie ergänzen die Data-Warehouse-Architektur mit notwendige Fähigkeiten, etwa für Data Discovery, Realtime Analytics und Advanced Analytics (Prognose).

Firmen zum Thema

Ab sofort steht das E-Book „Big-Data-Datenbanken“ für registrierte Leser von BigData-Insider kostenlos zum Download bereit.
Ab sofort steht das E-Book „Big-Data-Datenbanken“ für registrierte Leser von BigData-Insider kostenlos zum Download bereit.
(Bild: Vogel IT-Medien)

Daten sind längst zum neuen Erdöl geworden. Große Konzerne wie Google, Amazon oder Apple sammeln Daten über ihre Kunden, wo sie nur können. Sie tun das bereits seit Jahren mit Clickstreamanalyse, Social Media Analytics und vielen anderen Disziplinen, um lukrative Kundenprofile zu erstellen, die für die gezielte Werbung Gold wert sind. Die Digitalisierung aller Wirtschafts- und Lebensbereiche und wird diese bereits vorhandene Datenflut noch einmal um Größenfaktoren anschwellen lassen. Bereits betagt aussehende Schätzungen nehmen rund 44 Zettabyte im Jahr 2020 an. Umso wichtiger werden leistungsfähige Datenbanken.

Hadoop, Spark & Co.

Das E-Book Big-Data-Datenbanken stellt die beiden Klassiker unter den Datenbanken vor: Hadoop und Spark. Beide unterstützen die altehrwürdige Abfragesprache SQL, Streaming-Daten und Machine Learning. Besonders das sehr viel schnellere Spark erfreut sich durch seine spezifische Architektur, hohe Performance und vielseitige Programmierbarkeit starker Verbreitung. Das sind die notwendigsten Eigenschaften moderner Big-Data-Datenbanken. Dass jeweils eine Analyse-Lösung hinzukommt, ergibt sich aus der jeweiligen Anforderung des Fachbereichs. Doch je mehr IoT-Daten zu verarbeiten sind, desto mehr kann eine Big-Data-Datenbank auch als Frühwarnsystem fungieren und den optimalen Betrieb von Geräten sicherstellen.

Neben der Vorstellung der möglichen Architekturen für eine Big-Data-Datenbank stellt das E-Book Hadoop und Spark gesondert vor, bevor es die verschiedenen NoSQL-Datenbanktypen und deren Public-Cloud-Nutzung würdigt. Wie gesagt, muss eine IT-Abteilung ihr Data Warehouse keineswegs auf die Schrotthalde der Geschichte werfen, sondern kann sie durchaus geplant und bedarfsgerecht ergänzt zu einer virtuellen Architektur ausbauen. Das Logische bzw. Virtuelle Data Warehouse vereint vorerst sowohl Legacy- als auch Big-Data-Datenbanken auf eine vielseitig gestaltbare und doch performante Weise.

(ID:45320427)

Über den Autor