Suchen

Schemafreie SQL-Abfrage-Engine für Hadoop erreicht Produktionsstatus Apache Drill 1.0 veröffentlicht

| Autor / Redakteur: Dipl. -Ing. Thomas Drilling / Nico Litzel

Die schemafreie SQL-Abfrage-Engine für Apache Hadoop, NoSQL-Datenbanken und Cloud-Speicher erreicht mit Version 1.0 nach fast drei Jahren Entwicklungszeit einen produktionsreifen Status.

Firma zum Thema

Apache Drill erreicht mit Version 1.0 Produktionsreife
Apache Drill erreicht mit Version 1.0 Produktionsreife
(Bild: The Apache Software Foundation)

Das Apache-Projekt Drill – erst seit Dezember vergangenen Jahres ein Toplevel-Projekt der Apache Software Foundation – hat den Versionsstand 1.0 erreicht.

Drill ist eine Schema-freie SQL-Query-Engine für den Einsatz im Big-Data-Umfeld, also für Hadoop, NoSQL-Datenbanken und diverse Arten von Cloud-Speichern. Mit Apache Drill können Nutzer mithilfe von SQL-Abfragen auf nahezu alle derzeit verfügbaren Arten von Datenspeichern zugreifen, die keine eigene SQL-Abfrage-Engine oder Schnittstelle haben.

Der Allesfresser

Nach Angaben von Jacques Nadeau, Vice President bei Apache Drill, wurde Drill geschaffen, weil die Architektur aktueller relationalen Abfrage-Engines nicht mehr zeitgemäß sei. Die Arbeitsweise von Drill orientiere sich auch an Googles Analysetool Dremel. Drill kann Petabytes an Daten, die über tausende Server verteilt sind, in Sekunden durchsuchen.

Die Architektur von Apache Drill
Die Architektur von Apache Drill
(Apache Software Foundation)

Eine Besonderheit bei Drill ist dabei, dass die Daten nicht in einem vorgegebenen Schema vorliegen müssen, weil Drill die Abfrage im Verlauf der Ausführung an das von Drill erkannte Schema anpasst. Mit anderen Worten: Drill kann Daten direkt aus den jeweiligen Datenspeichern verarbeiten, ohne dass die Nutzer dazu erst ein Datenbankschema definieren oder Daten umwandeln müssten. So kommt Drill beispielsweise auch mit Daten im JSON-Format zurecht, wie sie die diversen NoSQL-Datenbanken liefern.

Neuerungen in Version 1.0

Neu in Version 1.0 sind unter anderen substanzielle Verbesserungen bei Stabilität, Geschwindigkeit und Speicherverwaltung. Ferner haben die Entwickler die CLI-Schnittstelle komfortabler gemacht, unter anderem mit Unterstützung für Shortcuts und Farben. Auch die Dokumentation wurde beträchtlich erweitert und auf den neuesten Stand gebracht, einschließlich zahlreicher Erweiterungen im Bereich der SQL-Referenz.

Dabei wurde auch die Kompatibilität des JDBC-Treibers verbessert, der jetzt auch Direct URLs für den Verbindungsaufbau verwenden kann, ohne Umweg über ZooKeeper. Weitere Details zur neuen Version finden sich in den Release Notes, sowie in der Dokumentation .

Download und Verfügbarkeit

Die Drill-Entwicklung wird von zahlreichen Unternehmen gemeinsam getragen, wobei insbesondere mehrere Hersteller von Business Intelligence Software Partner des Drill-Projektes sind oder eng mit diesem zusammen arbeiten, darunter Information Builders, JReport (Jinfonet Software), MicroStrategy, Qlik, Simba, Tableau und TIBCO. Daher stellt Drill auch ODBC- und JDBC-Treiber für solche SQL-basierten Lösungen zur Verfügung.

Apache Drill 1.0 kann ab sofort von der Projektseite heruntergeladen werden und steht ASF-typisch unter der Apache-Lizenz 2.0.

(ID:43408742)

Über den Autor

Dipl. -Ing. Thomas Drilling

Dipl. -Ing. Thomas Drilling

IT-Consultant, Trainer, Freier Journalist