Datenbank ist nicht gleich Datenbank

Informationsmanagement in Zeiten von Big Data

| Autor / Redakteur: Arsalan Minhas * / Nico Litzel

Im Big-Data-Umfeld bieten sich nicht-relationale Datenbanken, sogenannte NoSQL-Datenbanken, an. Diese Datenbanksysteme brechen mit den Eigenschaften rationaler Datenbanken und verwenden alternative Modelle.
Im Big-Data-Umfeld bieten sich nicht-relationale Datenbanken, sogenannte NoSQL-Datenbanken, an. Diese Datenbanksysteme brechen mit den Eigenschaften rationaler Datenbanken und verwenden alternative Modelle. (Bild: © tashatuvango - stock.adobe.com)

Eine der größten Herausforderungen unserer Zeit heißt Big Data: Unternehmen sehen sich mit riesigen Datenmengen konfrontiert, die gewinnbringend verarbeitet und analysiert werden sollen. Bislang kamen dafür hauptsächlich relationale Datenbankmanagementsysteme zum Einsatz. Immer populärer werden indes NoSQL-Varianten (not only SQL).

Relationale Datenbankmanagementsysteme (RDBMS) sind in erster Linie auf strukturierte Daten ausgelegt, die in Tabellen gespeichert sind, die wiederum in Beziehung (Relation) zueinander stehen. Mit RDBMS lassen sich diese Tabellen in unterschiedlichen Konstellationen kombinieren und auswerten. Für jede Tabelle werden verschiedene Kategorien in Spalten festgelegt. Die Zeilen wiederum enthalten die passenden Datensätze für die jeweiligen Kategorien. Das ist beispielsweise bei Kundendatenbanken der Fall. So gibt es verschiedene Spalten wie Vorname, Nachname, Adresse, Telefonnummer oder E-Mail-Adresse. Diesen ist pro Kunde und Zeile jeweils ein Wert zugeordnet.

Dabei ist besonders wichtig, dass jeder Datensatz innerhalb der Datenbank eindeutig zu identifizieren ist und dort auch nur einmal gespeichert wird. Dadurch, dass die Daten auf verschiedene Tabellen verteilt und miteinander verbunden sind, wird sichergestellt, dass die Datenbank redundanzfrei und konsistent ist. Als Datenbanksprache kommt SQL (Structured Query Language) zum Einsatz. So wird die Struktur der Daten definiert, Daten abgefragt, bearbeitet oder gelöscht. SQL basiert auf der rationalen Algebra und kommt dank einer einfachen Syntax mit wenigen Grundbefehlen aus.

Wenn es also darum geht, feste Strukturen abzubilden und Daten eindeutig miteinander zu verknüpfen, bieten relationale Datenbanken klare Vorteile. Selbst die komplexesten Datenabfragen nach verschiedenen Kriterien sind so kein Problem mehr. SQL-Datenbanken warten zudem mit umfassenden Tools auf, die die Entwicklung datenbankgestützter Anwendungen vereinfachen.

Relationale Datenbanken stoßen im Big-Data-Umfeld allerdings oftmals an ihre Grenzen. Das gilt besonders dann, wenn große Datenmengen gespeichert und verarbeitet werden sollen. Denn: RDBMS lassen sich nicht beliebig skalieren. Unstrukturierte Inhalte wie Bilder, Dokumente oder Daten aus der Kundenkommunikation sinnvoll zu speichern, ist ohne großen Aufwand kaum möglich. Je größer die Masse an unstrukturierten Daten wird, desto mehr Zeit benötigen Entwickler, sie in Tabellen zu pressen und zu verknüpfen.

NoSQL-Datenbankmanagementsysteme

Deshalb kommen im Big-Data-Umfeld immer häufiger nicht-relationale Datenbanken, sogenannte NoSQL-Datenbanken zum Einsatz. Diese Datenbanksysteme brechen mit den Eigenschaften rationaler Datenbanken und verwenden alternative Modelle. Sie verzichten auf starre Schemata beim Speichern von Daten oder überlassen das sogar komplett den Anwendungen. Beliebige Datensätze und -strukturen lassen sich so speichern und in hoher Geschwindigkeit verarbeiten: NoSQL-Datenbanken nutzen hier Wertepaare, Objekte, Dokumente oder Listen für die Organisation der Daten, wohingegen relationale Modelle auf Spalten und Zeilen setzen.

Data Scientists generieren aus diesen Datenbanken wertvolle Erkenntnisse, da sowohl strukturierte als auch unstrukturierte Datenquellen aus internen und externen Quellen kombiniert werden können. Sie eigenen sich, um große und exponentiell wachsende Datenmengen performant zu verarbeiten und skalierbare, verteilte Architekturen zu unterstützen. Große Datenmengen werden in einem Cluster auf Standardsystemen verwaltet und liegen nicht länger auf einem einzigen Server. Non-Relationale Systeme sind drüber hinaus einfach anzuwenden und zeichnen sich durch eine hohe Durchsatzrate und Leistungsfähigkeit aus. Zudem unterstützen sie aktuelle Hardwaregenerationen.

NoSQL-Datenbanken im Vergleich

NoSQL

NoSQL-Datenbanken im Vergleich

15.01.18 - NoSQL-Datenbanken wurden aus der Notwendigkeit heraus entwickelt, große, unterschiedliche Mengen von Dimensionen wie Raum, Zeit und Lokation auf möglichst effiziente Weise zu speichern und zu verarbeiten. Mittlerweile sind sie die unabdingbare Alternative zu relationalen SQL-basierten Datenbanken. Doch nicht jede NoSQL-Datenbank eignet sich für jeden Zweck. Tatsächlich sind die meisten sogar recht spezialisiert. lesen

Die Unterscheidungskriterien – SQL vs. NoSQL

NoSQL-Datenbanken ermöglichen das flexible Ändern von Datendefinitionen mit Versionierungen und Hintergrundkonvertierungen und funktionieren schemafrei. So lassen sich die stetig wachsenden Datenmengen performant, einfach und schnell verarbeiten. Zudem werden skalierbare, leistungsfähige und verteilte Architekturen unterstützt. Gerade wenn Unternehmen nicht wissen, mit welchen Datenmengen sie es zu tun haben oder große Mengen verschiedener Informationstypen bearbeiten müssen, helfen NoSQL-Datenbanken erheblich weiter. Sie sind einfach zu installieren, unterstützen verteilte Datenbank-Cluster und arbeiten auf den neuesten Hardwaregenerationen. Während SQL-Daten meistens nach dem ACID (Atomicity, Consistency, Isolation, Durability)-Prinzip gespeichert sind, verwenden NoSQL-Systeme das BASE (Basically Available, Soft State, Eventually Consistent)-Modell.

Gerade wenn Unternehmen bereits in eine entsprechende Infrastruktur investiert haben, haben relationale Datenbanksysteme auch in Zukunft ihre Berechtigung. Die Migrationskosten wären ansonsten sehr hoch. Gleichzeitig benötigen relationale Datenbanken weniger Rechenleistung und Speicherplatz. Zudem ist bei den non-relationalen Pendants ein fundiertes Wissen und SQL-Grundkenntnisse nötig. Mitarbeiter wiederum müssen sich an nicht-standardisierte Interfaces gewöhnen. Darüber hinaus kommt es gerade bei veralteten Zugriffe in Verbindung mit Echtzeitanwendungen oftmals zu ungenauen Ergebnissen.

Zukunftsaussichten

Der Trend wird auch in Zukunft weiter in Richtung non-relationale Datenbankmanagementsysteme gehen. Unternehmen verfügen bereits heute über einen riesigen Datenschatz, den sie nur in den wenigsten Fällen gewinnbringend nutzen können. Dazu fehlen jedoch oftmals fortschrittliche Analysemethoden, die aus diesen Daten wertvolle Geschäftseinblicke generieren. Viele befinden sich noch in der Early-Adopter-Phase. Da Anwender mehr und mehr auf maschinell-generierte Empfehlungen setzen werden, wird die Nachfrage nach non-relationalen Datenbanken zweifelsohne steigen.

* Arsalan Minhas ist Director Solution Consulting bei OpenText

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 45098351 / Infrastruktur)