NoSQL-Datenbanken und Big Data

Datastax-Nutzer setzen auf Cloud Service

| Autor / Redakteur: Ariane Rüdiger / Nico Litzel

Mit Datastax können Daten auf beliebigen angeschlossenen Cloud-Ressourcen gespeichert werden.
Mit Datastax können Daten auf beliebigen angeschlossenen Cloud-Ressourcen gespeichert werden. (Bild: Datastax)

Datastax gehört zu den erfolgreichen „Resten“ der NoSQL-Gründungswelle der Nuller-Jahre. Das Unternehmen bietet nun seine Datenbank auch in der Oracle-Cloud an, denn die Mehrzahl der Anwender nutzt sie bereits als Cloud-Service. Viel Engagement fließt in Weiterbildung und Unterstützung der Anwender bei der Implementierung neuer Geschäftsmodelle.

Dass die Datenmassen ständig wachsen, ist mittlerweile eine Plattitüde. Es lohnt sich nicht, um die eine oder andere Null hinter den gigantischen Zahlen, die Jahr für Jahr hinsichtlich des demnächst zu erwartenden und bereits stattfindenden Datenwachstums präsentiert werden, zu streiten. Sicher ist: Die traditionellen Datenbanken sind mit den nun sich auftürmenden Datenmassen schlicht überfordert. Das gilt erst recht, wenn diese Daten schnell, vielleicht sogar in Echtzeit, analysiert und gegebenenfalls an existierenden Datenbeständen abgeglichen werden sollen. Hier sind klassische Datenbankformate, sei dies nun Microsoft SQL, Oracle oder eines der unzähligen anderen relationalen Datenbankprodukte, überfordert.

Das zeigte sich schon in den Nuller-Jahren. Damals stieß Facebook an die Grenzen bisheriger Datenbanksysteme: Die Inboxen der Anwender ließen sich nicht mehr schnell genug durchsuchen, dafür enthielten sie einfach zu viele Daten. Also wurde Cassandra entwickelt und 2009 als Open Source der Apache-Foundation zur Verfügung gestellt. Cassandra ist ein Datenbankmanagementsystem, das in Java geschrieben wurde. Es speichert große, strukturierte Datenmengen auf verteilten Clustern, ist skalierbar und ausfallsicher.

Grundlagen der NoSQL-Datenbank Apache Cassandra

Cassandra- und NoSQL-Bascis, Teil 1

Grundlagen der NoSQL-Datenbank Apache Cassandra

21.12.15 - Cassandra zählt, neben MongoDB, zu den derzeit populärsten NoSQL-Datenbanken. Cassandra ist als skalierbares, ausfallsicheres System für den Umgang mit großen Datenmengen auf verteilten Systemen (Clustern) konzipiert. In drei Teilen erläutert BigData-Insider die architektonischen Merkmale von Cassandra, erklärt die Inbetriebnahme sowie grundlegende Prinzipien und illustriert erste Schritte mit der Abfragesprache Cassandra Query Language (CQL). lesen

„Wir müssen uns im Moment weniger um neue Features als um die Implementierung kümmern“, Billy Bosworth, CEO Datastax.
„Wir müssen uns im Moment weniger um neue Features als um die Implementierung kümmern“, Billy Bosworth, CEO Datastax. (Bild: Rüdiger)

Datastax Enterprise (DSE)

Auch Datastax baute sein Datenbank-Produkt Datastax Enterprise (DSE) auf Cassandra auf. Das Unternehmen wurde 2010 in Austin, Texas, gegründet und beschäftigt inzwischen 480 Mitarbeiter in 25 Ländern, rund 20 davon in Europa. Ein deutsches Büro gibt es in Berlin, weitere europäische Niederlassungen sind in Paris und London. Rund 15 Prozent der Umsätze, über die sich die noch nicht profitable Firma ausschweigt, stammen aus Europa, fünf Prozent aus Asien, der Rest aus den USA. Das Wachstum liegt derzeit noch bei über 40 Prozent pro Jahr. Ein positiver Cashflow, ist, so CEO Billy Bosworth, „in Sichtweite“. Doch habe die Expansion des Venture-Capital-finanzierten Unternehmens derzeit Vorrang vor der Profitabilität. Fünf Finanzierungsrunden wurden erfolgreich bestritten.

Mit ihrem neuartigen Datenbank-Ansatz stand Datastax 2010 nicht allein „Mindestens 250 No- oder Post-SQL-Datenbankansätze gab es damals“, erinnert sich Bosworth. Inzwischen habe sich das Feld sehr gelichtet. „Es gibt im Moment noch fünf oder sechs ernsthafte Konkurrenten“, sagt er.

Bosworth ist kein Datastax-Urgestein, sondern kam zusammen mit 20 weiteren Mitarbeitern von Quest, nachdem der Spezialist für Systemmanagementlösungen von Dell übernommen wurde. Diese Lösungen unterstützten zunächst nur relationale, später aber auch alle möglichen Post-SQL-Datenbanken. Gründer Jonathan Ellis, der die Rolle als CTO wahrnimmt, saß bis vor Kurzem gleichzeitig dem Projekt Cassandra der Apache Foundation vor, was belegt, wie groß derzeit der Einfluss von Datastax auf Cassandra ist oder jedenfalls war.

Übernahmen

Während das Unternehmen die Jahre zwischen 2010 und 2013 mit dem Trommeln für das Grundprojekt, die Datastax-Variante von Cassandra, verbrachte, kamen in den letzten Jahren weitere Technologien hinzu, etwa für die Suche (Solr), für die Analyse (Spark) oder für die Graphenverarbeitung. Hierzu kaufte Datastax Aurelius mit seiner Lösung Titan. Alles wurde zu einem integrierten Projekt verstrickt, das als Ganzes proprietär bleiben wird. „Wir tragen aber weiter auch Open Source Code zur Weiterentwicklung von Cassandra bei“, betont Bosworth. Speichern kann die Datenbank mit ihrem Multi-Modell-Ansatz Grafiken, JSON, Dokumente, Tabellen und Key-Value-Stores.

Als Alleinstellungsmerkmale seiner Lösung sieht der CEO den masterlosen Betrieb, die globale Reichweite der Datenbank und fein granulare, bis auf Transaktionsebene separat festlegbare Redundanzlevel. „Wir können einen Schreibvorgang beispielsweise quittieren, wenn auf nur eine Redundanz-Lokation ein Schreibvorgang stattgefunden hat oder erst, wenn das an der Mehrzahl der Speicherorte der Fall war oder an einem anderen Punkt“, erklärt Bosworth. Wichtige Konkurrenten sind andere neuartige Lösungen wie Mongo DB oder Couchbase.

So funktioniert Cassandra

Cassandra- und NoSQL-Basics, Teil 2

So funktioniert Cassandra

28.12.15 - Cassandra zählt zu den derzeit populärsten NoSQL-Datenbanken. Im zweiten Teil geht es um die grundlegende Arbeitsweise von Cassandra. lesen

Die klassische Datenbank ist für Bosworth kaum eine Konkurrenz. „Meist landen die Daten der traditionellen Applikationen weiter in der gewohnten relationalen Datenbank, oder diese Applikationen greifen auf die relationale Datenbank zu. Neue Applikationen nutzen parallel unsere Lösung“, erklärt Bosworth.

Anwendungsfälle

Dabei sind typische Anwendungsfälle weniger spezifischen Branchen, sondern eher dem generellen Umfeld zugeordnet. Bosworth teilt sie in zwei große Gruppen: Einerseits die extern fokussierten Apps, die sich mit Themen rund um das Nutzungserlebnis eines Angebots befassen. Dazu gehören Themen wie eine Rundumsicht auf den Kunden, Empfehlungen und persönliche Angebote, Betrugsvorbeugung oder Authentisierungslösungen. Andererseits unterstützt Datastax interne Applikationen wie die IoT-gestützte Bestandsverwaltung, die Optimierung von Lieferkette und Logistik oder das Asset Management.

Datastax gibt es als Produkt für den On-Premise-Einsatz, als gemanagten Cloud-Service aus der Datastax-Cloud und auch als AWS-Service. Manche Kunden nutzen VMs auf AWS oder Azure, um dort ihre Datastax-Instanz zu installieren. Seit neuestem besteht auch ein Partnerschaftsabkommen mit Oracle zur Unterstützung von Oracle Cloud. „Wir richten uns mit dem Ausbau der Cloud-Unterstützung nach den Marktanteilen der Anbieter“, sagt Bosworth. Insgesamt laufen inzwischen 70 Prozent der Datastax-Workloads in der Cloud, was zeigt, dass sich diese Erbringungsform inzwischen auch in kritischen Geschäftsbereichen immer stärker durchsetzt. Der Vertrieb erfolgt aber derzeit vorwiegend direkt. Zu den Kunden gehört beispielsweise der Online-Handelsriese eBay.

So funktionieren Abfragen in Apache Cassandra

Cassandra- und NoSQL-Basics, Teil 3

So funktionieren Abfragen in Apache Cassandra

04.01.16 - Die NoSQL-Datenbank Cassandra ist als skalierbares, ausfallsicheres System für den Umgang mit großen Datenmengen auf verteilten Systemen (Clustern) konzipiert. Im dritten Teil geht es um das Arbeiten mit Cassandra. lesen

Freilich fehlt vielen Anwendern noch das Know-how, mit der neuen NoSQL-Welt effizient und mit optimalem Nutzen fürs eigene Unternehmen umzugehen. Auch in den großen Unternehmen, die Datastax vorwiegend bedient, ist das so. Deshalb besteht das nächste Ziel des Datenbankspezialisten vor allem in einem Ausbau der Training-Aktivitäten auf allen Ebenen. „Es geht im Moment nicht um neue Features, sondern um die Implementierung“, betont Bosworth. Client-Server habe viele Jahre gebraucht, um sich in den Unternehmen fest zu etablieren. Nun tickten die Uhren eben schneller.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44941935 / Infrastruktur)