Kommentar von Dominic Wellington, MongoDB Die Rückkehr der Multi-Purpose-Datenbank

Von Dominic Wellington

2009 wurde mit NoSQL eine neue Kategorie von Datenbanken vorgestellt. Sie waren hoch spezialisiert und schienen zunächst das Ende der Herrschaft der relationalen SQL-Datenbanken einzuläuten, die den Markt vorher fast unangefochten dominiert hatten und nicht über die Spezialisierungsmöglichkeiten verfügten, um unterschiedliche Anforderungen und Datentypen abzudecken. Doch heute erleben Allzweckplattformen ein Comeback.

Anbieter zum Thema

Der Autor: Dominic Wellington ist Direktor für Marktforschung bei MongoDB
Der Autor: Dominic Wellington ist Direktor für Marktforschung bei MongoDB
(Bild: MongoDB)

Es sind längst nicht mehr nur Unternehmen aus der Softwarebranche, die für den Erfolg ihrer Geschäftsmodelle auf die schnelle Entwicklung innovativer Anwendungen angewiesen sind. Ob Airline, Energieversorger, Händler oder Fitnessanbieter: Eine hoch funktionale eigene App ist heute Standard und wird von Kunden erwartet. Häufig genutzte Apps wie soziale Medien oder Streaming-Plattformen definieren dabei die Erwartungshaltung an Reaktionsfähigkeit, Optimierung für mobile Geräte, Aufbereitung gewünschter Inhalte und Informationen, Sicherheit, Personalisierbarkeit und Aktualisierungen und Einblicke in Echtzeit. Der „Motor“ hinter diesen Anwendungen, die längst fest zu unserem Alltag gehören, sind Daten und deren Lagerung und Verarbeitung in Datenbanken.

Der Vorläufer der Structured Query Language (SQL), auf der relationale Datenplattformen beruhen, wurden bereits in den siebziger Jahren entwickelt. SQL-Datenbanken waren lange Zeit die Grundlage für datengetriebene Anwendungen. Die Zunahme mobiler Endgeräte und Apps stellte jedoch neue Anforderungen an die Agilität von Datenbanken. Die für diese Anwendungen gesammelten Daten beschränken sich nicht auf eine begrenzte Anzahl von Attributen, die Datensätze wurden zunehmend unstrukturiert und komplex. Die starre Struktur relationaler Datenbanken, die letztlich aus Zeilen und Spalten besteht, wird dieser Komplexität nicht gerecht und erschwert das Speichern, Analysieren und Abfragen.

Das relationale Modell stieß in den Nullerjahren an seine Grenzen. Ad-hoc-Änderungen in der Struktur der zu speichernden Daten oder in den Mustern ihrer Abfrage blieben schwierig. Architekturen wie z. B. die großer Online-Händler mit ihren enormen Datenmengen und ihrem Bedarf an Back-End-Datenanalyse trieben die Nachfrage nach einem anderen Ansatz.

Spezialisierte Modelle: Konkurrenz, aber kein Ersatz für SQL

Im Kielwasser der Veranstaltung NoSQL 2009 entstanden verschiedene neue Datenbanktypen: Dokumentendatenbanken, Graphdatenbanken, kolumnare Datenbanken, In-Memory-Datenbanken, Key-Value-Stores, Streaming-Plattformen. Bei allen handelt es sich um spezialisierte Lösungen, die für bestimmte Anwendungsfälle entwickelt wurden und zunächst auch nur für diese geeignet waren. Sie alle hatten spezifische Vor- und Nachteile.

Relationale Datenbanken verschwanden unterdessen nicht von der Bildfläche. Bis heute nutzen sie viele Unternehmen, aber bei der Anfrage, Analyse und effektiven Verarbeitung der stetig wachsenden Datenfluten bremsen ihre Schwächen Entwickler aus. Von den neuen Modellen sind Dokumentendatenbanken heute die verbreitetste Alternative. Ihre Beliebtheit ist der Flexibilität geschuldet, die die Darstellung vieler Datenstrukturen ermöglicht. Objekte werden als Dokumente mit möglicherweise verschiedenen Attributen gespeichert. Diese Attribute oder „tags“ ermöglichen mithilfe von Deep Learning zunehmend auch eine Mustererkennung, die bei Abfragen das Auffinden von Resultaten beschleunigt.

Dokumentendatenbanken: Beliebteste SQL-Alternative bei Entwicklern

Anstelle der starren Zeilen- und Spaltenstruktur des relationalen Modells bilden Dokumentendatenbanken ihre interne Darstellung direkter auf Objekte im Code ab, wodurch die bei relationalen Datenbanken erforderliche zusätzliche Abbildungsebene entfällt. Der Vorteil dieser Ähnlichkeit ist, dass sie, da sie auf JSON-ähnlichen Dokumenten basieren, für Entwickler äußerst intuitiv zu verwenden sind. JSON ist ein sprachunabhängiges und von Menschen lesbares Format, das sich zu einem weit verbreiteten Standard für die Speicherung und den Austausch von Daten entwickelt hat, insbesondere für Webanwendungen.

Ein wesentlicher Vorteil von Dokumentendatenbanken besteht darin, dass die Struktur der Daten, das sogenannte Schema, in der Datenbank nicht vordefiniert werden muss und dass Ad-hoc-Änderungen in diesem Schema jederzeit möglich sind. Solche Änderungen können aus einer Vielzahl von Gründen erfolgen: Quelldaten, die in einem anderen Format geliefert werden, neue erweiterte Daten, die erfasst, oder neue Abfragen, die unterstützt werden sollen. Die Schemaverwaltung ist ein wesentlicher Bestandteil der Arbeit mit relationalen Datenbanken, bei denen die Struktur der Daten im Voraus abgebildet werden muss, um Abfragen über die Beziehung zwischen verschiedenen Elementen zu unterstützen. Die Fähigkeit, diese Änderungen ohne umfangreiche Überarbeitung des Datenbank- und Anwendungscodes unterstützen zu können, erhöht die Flexibilität von Entwicklern, die aus diesem Grund bevorzugt mit Dokumentendatenbanken arbeiten, erheblich.

Welchem Ansatz gehört die Zukunft?

Für Unternehmen bietet die Dokumentendatenbank großes Potenzial, Big Data sinnvoll zu nutzen. Ihre vertikale und horizontale Skalierbarkeit sorgt dafür, dass sie mit der Entwicklung eines Geschäftsmodells und dem Anwachsen der Datenmengen „mitwächst“. Relationale Datenbanken sind jedoch bei webbasierten Applikationen und im Online-Publishing noch immer häufig anzutreffen. Spezialisierte Modellen werden je nach Einsatzzweck und Anforderungen ausgewählt. Sah es eine Weile so aus, als gehörte unterschiedlichen, spezialisierten Datenbanken die Zukunft, ist inzwischen eine Trendumkehr erkennbar, denn viele Unternehmen zieht es wieder stärker zu den „Generalisten“ unter den Modellen, die sich für eine Vielzahl von Anwendungsfällen in der gesamten Organisation eignen.

Dafür gibt es mehrere Gründe:

  • Nutzer spezialisierter Datenbanken drängen auf Funktionserweiterungen, damit sie nicht zwischen verschiedenen Datenspeichern wechseln müssen, weil sie bestehende Datensätze über organisatorische und technologische Grenzen hinweg konsolidieren wollen.
  • Auch Entwickler wollen mehr Integration. Zwar wünscht sich niemand die relationale Struktur als einzige Option zurück. Doch anstelle des Aufwandes bei der Datenabfrage und -analyse innerhalb dieser Struktur erhöht sich für sie zunehmend der Aufwand für die Integration verschiedener spezialisierter Datenbanken, die jeweils spezifischen Anwendungen zugrunde liegen. Das kann im Extremfall dazu führen, dass die Vorteile ihrer Agilität in einem bestimmten Bereich durch den höheren Integrationsaufwand zunichtegemacht werden.

Trend zur Multi-Purpose-Datenplattform

Datenbankanbieter haben die Trendumkehr längst erkannt und reagieren: Ihre Modelle sind heut deutlich weniger hoch spezialisiert sind als in den Anfangstagen des NoSQL-Konzepts. Die Dokumentendatenbank von MongoDB bietet bereits seit Version 4.2 Data Lake, Diagramme und andere Analysefunktionen und seit Version 5.0 (2021) auch Zeitreihenfunktionen. Auch Anbieter anderer Modelle erweitern ihre Lösungen um neue Funktionen und bewegen sich damit wieder stärker in Richtung universelle Einsetzbarkeit.

Diese Konsolidierung hat auch handfeste wirtschaftliche Gründe. Die Betriebskosten, die durch die Pflege mehrerer spezialisierter Datenspeicher entstehen, sind erheblich und führen nicht selten wieder zur Entstehung von Betriebssilos, die kein Unternehmen im Prozess der Digitalisierung brauchen kann: Daten, die in einem bestimmten Format in einem System gespeichert sind, müssen umgewandelt werden, damit sie mit anderen Systemen und den Teams, die sie nutzen, gemeinsam genutzt werden können.

Gestiegene Sicherheitsstandards sind leichter zu erfüllen

Datensicherheit und Datenschutz stehen auf der Agenda von Unternehmen sehr weit oben: Vorgaben für den Umgang mit sensiblen Daten wurden in den vergangenen Jahren kontinuierlich strenger, die gestiegene Anzahl an mobilen Geräten und Zugriffspunkten durch Distanzarbeit und die zunehmende Verlagerung der enormen Datenmengen in die Cloud ließ Cyberangriffe mit Datendiebstahl sprunghaft ansteigen. Je höher die Zahl der Plattformen, desto aufwändiger wird das Einhalten von Compliance- und Sicherheitsanforderungen. Jeder Datenspeicher muss separat abgesichert werden. Seine Konfiguration muss auf die Einhaltung interner und externer Vorschriften hin überprüft werden. Eine Multi Purpose-Datenplattform bietet dagegen einen einzigen Kontrollpunkt für die Sicherung und Einhaltung der Vorschriften, zusätzlich zu der betrieblichen Vereinfachung, die sich daraus ergibt, dass sich alles an einem Ort befindet.

Während Anbieter spezialisierter Plattformen ihre Datenbanken um Funktionen ergänzen, um sie hinsichtlich ihrer Eignung für unterschiedliche Anwendungsfälle breiter aufzustellen, ergänzen gleichzeitig Anbieter von Allzweckplattformen spezialisierte Funktionen. Auch dadurch entfällt zunehmend der Wettbewerbsvorteil der spezialisierten Datenspeicher und damit auch die Notwendigkeit, diese aufwändig zu pflegen. Moderne Anwendungsdatenplattformen können Textsuche, Zeitreihendatenverarbeitung und Analysen direkt in der Kernplattform unterstützen, ohne dass spezielle Systeme integriert und der Datenaustausch mit ihnen eingerichtet werden muss. Während sich Datenbankanbieter in den Jahren nach NoSQL im Jahr 2009 zunehmend von Allzweck-Workloads entfernten, ist die Gegenbewegung in den letzten drei Jahren klar erkennbar.

Fazit

Unternehmen sollten bei der Auswahl einer einzelnen Datenbank nicht nur traditionelle relationale Datenmodelle und neuere Ansätze vergleichen. Stattdessen sollten sie eine umfassende Datenplattform in Betracht ziehen, deren zugrundeliegendes Datenmodell so viele Anforderungen wie möglich unterstützen kann. Der Wandel am Datenbankmarkt wird durch die Nachfrage von Entwicklern getrieben, die den Anforderungen von Endnutzern gerecht werden müssen, die geschäftsrelevante Erkenntnisse aus ihren Daten gewinnen wollen und müssen.

Als Gewinner aus dem Rennen werden Datenplattformen hervorgehen, die die Bereitstellung der gewünschten Funktionen ermöglichen. Definitionsgemäß erfordert dieses Ziel eine einheitliche Sicht auf die Daten und eine Vielzahl von Tools, mit denen sie analysiert werden können. Das ist es, was moderne Anwendungs-Datenplattformen bieten. Die Zukunft wird also wahrscheinlich denjenigen Lösungen gehören, die das Beste aus beiden Welten vereinen und für ein breites Spektrum von Anwendungen eingesetzt werden können, bei Bedarf aber auch spezialisierte Funktionen zur Verfügung stellen.

(ID:48035897)