E-Book von BigData-Insider NoSQL-Datenbanken

Autor / Redakteur: Michael Matzer / Nico Litzel

Aus dem täglichen Umgang mit dem Internet ist die Nutzung von verknüpften Daten nicht mehr wegzudenken. Seien es Freundschaftskreise auf Facebook und LinkedIn, Taxi-Anforderungen auf Uber oder Empfehlungen auf Amazon und Ebay – immer tritt im Hintergrund eine Datenbank in Aktion, die verwandte Daten sucht und miteinander in Beziehung setzt. Dabei handelt es sich in den meisten Fällen um eine NoSQL-Datenbank.

Firmen zum Thema

Ab sofort steht das E-Book „NoSQL-Daenbanken“ für registrierte Leserinnen und Leser von BigData-Insider kostenlos zum Download bereit.
Ab sofort steht das E-Book „NoSQL-Daenbanken“ für registrierte Leserinnen und Leser von BigData-Insider kostenlos zum Download bereit.
(Bild: Vogel IT-Medien)

NoSQL heißt dabei lediglich „not only-SQL“, ist also nicht negativ gemeint. Denn die Abfragesprache SQL ist so weit verbreitet, dass sehr viele Datenbankentwickler über entsprechende Kenntnisse verfügen, um alte SQL-Programme zu nutzen und neue Datenbank-Anwendungen erstellen zu können. Deshalb findet man zunehmend Hybridformen, die eben nicht nur ein neues Datenbankmodell vorstellen, sondern auch SQL unterstützen.

Not only SQL – es gibt Graph-Datenbanken, dokumentenorientierte Datenbanken, Key-Value-Datenbanken, Objektdatenbanken, spaltenorientierte Datenbanken und Streaming-Datenbanken. Sie basieren in der Regel auf Open-Source-Projekten wie etwa Apache Kafka oder Apache JackRabbit. Der Vorteil: Der Nutzer kann den Quellcode selbst seinen Anforderungen und Wünschen anpassen. Er sieht sich daher in der Regel nicht an einen einzigen Anbieter gebunden, was für viele Unternehmen ein wichtiges Kriterium ist.

Beispiel: Graph-Datenbanken

Wo relationale Datenbanken (RDBMS) die zu speichernden Daten in ihre Bestandteile zerlegen, um sie in Zeilen und Spalten zu stopfen, tun Graph-Datenbanken das Gegenteil: Sie belassen die Daten, wo sie sind und erfassen sie in einem Modell, das in der Regel aus Knoten, Kanten (Beziehungen), Eigenschaften besteht: Dieser Graph bietet den Kontext, den Nutzer wie Facebook oder Amazon ihren Kunden bieten müssen, um sowohl das Kundenerlebnis zu verbessern, als auch um selbst die Erfolgsquote bei der Lead-Konversion zu verbessern: Aus Besuchern sollen Fans und aus Fans Käufer werden.

Use Cases

Die Anwendungsfälle reichen noch wesentlich weiter, vom Einsatz in der Streckenoptimierung über Genom-Analyse bis hin zu Betrugserkennung und Verbrechensbekämpfung. In der IT werden Graph-Datenbanken in der Netzwerkanalyse, der Anomalieerkennung (SIEM) und im Master Data Management (MDM) genutzt. Die Liste ließe sich fortsetzen.

Die Mehrzahl der NoSQL-Datenbanken entstand aus dem Open-Source-Markt und ist diesem immer noch verpflichtet. Das unterscheidet sie einerseits von den proprietären RDBMS wie SAP und Oracle, bedeutet aber auch eine gewisse Zersplitterung hinsichtlich eines gemeinsamen Standard in Sachen Abfrage. Auf dem Weg zu einer internationalen und allgemeinen Anerkennung seiner Abfragesprache Cypher ist der Anbieter Neo4J durch seine marktbeherrschende Stellung und durch geschickte Partnergewinnung kurz vor dem Ziel: eine standardisierte Abfragesprache für alle Graph-Datenbanken.

In Sachen Modernität brauchen sich alle NoSQL-Datenbanken nicht zu verstecken. Stets lassen sich moderne Algorithmen, die etwa aus R Studio oder Python stammen können, für Machine Learning nutzen. Für Deep Learning steht in der Regel eine Anbindung an Google TensorFlow, PyTorch usw. bereit. Eine Visualisierung erfolgt häufig mit bordeigenen Mitteln oder mit verbreiteten Werkzeugen wie Qlik und Tableau.

Das E-Book „NoSQL-Datenbanken“ macht Leser zunächst mit der Vielfalt, den Eigenheiten und den Anwendungsgebieten von NoSQL-Datenbanken bekannt. Wer schon Erfahrung mit relationalen Datenbanken (RDBMS) mitbringt, ist klar im Vorteil, denn Begriffe wie ACID-Konformität sind dann bereits bekannt.

Artikelfiles und Artikellinks

(ID:47743233)