Bei Big Data haben NoSQL-Datenbanken ihren großen Auftritt

Kommentar von Paul Salazar, Couchbase Bei Big Data haben NoSQL-Datenbanken ihren großen Auftritt

10.07.2020 Von Paul Salazar

Anbieter zum Thema

Couchbase Germany GmbH

fsas-afc-horizontal-2-positive-rgb-nov24 (Fsas)

Fsas Technologies GmbH

INFOMOTION GmbH

Fivetran Germany GmbH

Unternehmen stehen vor der Herausforderung, Unmengen an Daten zu speichern, zu verarbeiten und zu analysieren. Im Gegensatz zu relationalen Datenbanken, die mit der neuen Datenwelt zu kämpfen haben, spielen NoSQL-Datenbanken im Big-Data-Zeitalter ihre Vorteile aus.

Der Autor: Paul Salazar ist Senior Director Central Europe bei Couchbase(Bild: Couchbase) — Der Autor: Paul Salazar ist Senior Director Central Europe bei Couchbase
(Bild: Couchbase)

Der Siegeszug des IoT und anderer vernetzter Datenquellen hat zu einem gewaltigen Zuwachs der Datenmengen geführt, die von Unternehmen erfasst, verwaltet und analysiert werden. Big Data verspricht große Erkenntnisse für Unternehmen jeder Größe und jeder Branche – wobei es nicht darum geht, wie viele Daten eine Firma hat, sondern was sie daraus macht. Richtig eingesetzt, können Kosten gesenkt, neue Produkte und optimierte Angebote entwickelt sowie klügere geschäftliche Entscheidungen getroffen werden.

Die Daten allerdings, deren Volumen heute schnell den Terabyte-Bereich erreicht, liegen nicht mehr unbedingt nur sauber strukturiert, sondern auch unstrukturiert als Mails, Dokumente, Fotos oder Videos vor. Mit diesem wilden Mix, der sich nicht oder nicht so einfach in Tabellen-Form bringen lässt, kommen die klassischen relationalen Datenbank-Managementsysteme (RDBMS) mit ihren fixen Strukturen zwar auch zurecht, allerdings nur über Umwege und Workarounds. Diese Umwege lassen jedoch die Kosten steigen, gleichzeitig sinkt die Performance.

NoSQL-Lösungen sind flexibler

Als Reaktion auf die Schwächen relationaler Datenbankmanagementsysteme sind NoSQL-Datenbanken entstanden: Irgendwann waren die klassischen Systeme zu langsam, nicht ausreichend skalierbar und nicht agil genug, da sie nicht verteilt arbeiten können. So beherrschen die meisten RDBMS außer der vertikalen Skalierung (Scale-up) nur rudimentäre Formen der horizontalen Skalierung (Scale-out). Failover-Clustering basiert in diesem Fall auf gemeinsam genutztem Speicher, während Always-on-Verfügbarkeitsgruppen auf Replikation beschränkt sind. Wächst das Datenvolumen, müssen Administratoren ein größeres System installieren und bei steigenden Benutzerzahlen einen leistungsfähigeren Server. Ansonsten wird ein solches System nicht nur zu einem Engpass, sondern zu einem Single Point of Failure.

Im Unterschied dazu sind NoSQL-Lösungen bei der Datenaggregation flexibler, weil sie mit Objekten anstelle von festen Tabellen arbeiten und diese mit einem objektorientierten Format verarbeitet werden können. Dieses JSON-Dokument – JSON ist ein Akronym für JavaScript Object Notation – kann unterschiedliche, auch wechselnde Datentypen beinhalten und die Länge darf je nach vorliegendem Datenmaterial variieren. Zudem nutzen NoSQL-Datenbanken normalerweise eine horizontale Skalierung, bei der die Daten auf zusätzliche kostengünstige Server verteilt werden. Auch mehr Benutzer werden auf mehr Server aufgeteilt, um Latenzzeiten niedrig zu halten. Couchbase hält, das belegen Benchmarks, die Performance-Steigerung über beliebig viele Nodes konstant aufrecht.

Um eine hohe Verfügbarkeit zu gewährleisten, unterstützt Couchbase zudem mit einer standardmäßig vorhanden dedizierten Cross-Datacenter-Replication-Funktion (XDCR) die uni- und bidirektionale Replikation zwischen geografisch voneinander getrennten Datacentern. Viele RDBMS dagegen benötigen für die Replikation zusätzliche Software – und das bedeutet höhere Lizenzkosten. Moderne NoSQL-Datenmanager halten zudem einen Großteil der aggregierten Daten im schnellen Arbeitsspeicher (RAM), was die Auswertung beschleunigt.

E-Commerce und NoSQL-Datenbanken

E-Commerce ist ein gutes Beispiel für den Einsatz von NoSQL-Datenbanken. Online-Shops locken immer wieder mit Sonderaktionen wie Black Friday oder Cyber Monday. In dieser Zeit explodieren die Userzahlen und damit die Datenmenge, entsprechend ist eine hohe Skalierbarkeit Grundvoraussetzung, um diese Arbeitslast bewältigen zu können. Hier spielen NoSQL-Datenbanken ihre Vorteile aus, sie sind feingranular über Nodes skalierbar, die in Clustern organisiert sind. Das erlaubt eine fast grenzenlose Flexibilität, da man ganz einfach das Cluster vergrößern und nach der Spitze auch wieder reduzieren kann.

Der klassische JOIN frisst richtig viel Zeit

Zu einer richtigen Performance-Bremse kann bei komplexen Analysen der SQL-Operator JOIN werden. Er ist in klassischen RDBMS notwendig, weil für umfangreichere Auswertungen in der Regel mehrere relationale Tabellen über Schlüsselindizes miteinander verbunden werden müssen – nur in seltenen Fällen befinden sich alle Daten, die ausgewertet werden sollen, in einer einzigen Tabelle. Dokumenten-Datenbanken dagegen sind in der Lage, die Daten mehrerer relationaler Tabellen in einem einzigen JSON-Objekt abzuspeichern.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

JSON-Dokumente erlauben Verschachtelungen und können dadurch auch komplexe Strukturen sehr gut abbilden. Der Vorteil: Es ist lediglich eine einzige Lese-Operation nötig und der Analyse-Algorithmus hat sämtliche benötigten Daten im Zugriff. Es gibt auch keine Unverträglichkeit (Impedance Mismatch) zwischen Anwendungsobjekten und JSON-Dokumenten. Die NoSQL-Datenbank Couchbase Server speichert JSON-Dokumente in „Buckets“ und Unternehmen können diese bei der Implementierung auf mehrere Serverknoten verteilen.

Entwickler und Business-Analysten müssen zudem keine neue Technologie erlernen. Mit N1QL können Anwender die gewohnte Syntax und Semantik der Abfragesprache SQL auch weiterhin nutzen, um Suchanfrage über JSON-Dokumente auszuführen, neue Datenbanken und Dokumente anzulegen oder um bereits vorhandene Dokumente zu pflegen. Hinzu kommen Features wie eine Volltextsuche oder Ad-hoc-Analytics. Moderne Datenbanken sollten zudem wahlweise on-premises oder in der Cloud laufen können. Unternehmen kombinieren heute die Cloud-Dienste, die ihre individuellen Anforderungen am besten gerecht werden, und wollen dabei nicht durch proprietäre Hürden behindert werden.

Auch wenn Big Data immer mehr an Bedeutung gewinnt, werden nicht alle Unternehmen sämtliche Legacy-RDBMS in einem Schritt auf eine moderne NoSQL-Datenbank migrieren. Das ist auch gar nicht nötig, denn NoSQL und RDBMS bilden ein starkes Team: Eine NoSQL-Datenbank übernimmt zum Beispiel als performanter Cache-Server die neuen modernen Datentypen, während ein RDBMS das klassische, transaktionale Datenbankgeschäft erledigt. Kunden profitieren dadurch vom Besten aus beiden Welten.

(ID:46627973)