Schemafreie SQL-Abfrage-Engine für Hadoop erreicht Produktionsstatus Apache Drill 1.0 veröffentlicht

Anbieter zum Thema

Die schemafreie SQL-Abfrage-Engine für Apache Hadoop, NoSQL-Datenbanken und Cloud-Speicher erreicht mit Version 1.0 nach fast drei Jahren Entwicklungszeit einen produktionsreifen Status.

Apache Drill erreicht mit Version 1.0 Produktionsreife
Apache Drill erreicht mit Version 1.0 Produktionsreife
(Bild: The Apache Software Foundation)

Das Apache-Projekt Drill – erst seit Dezember vergangenen Jahres ein Toplevel-Projekt der Apache Software Foundation – hat den Versionsstand 1.0 erreicht.

Drill ist eine Schema-freie SQL-Query-Engine für den Einsatz im Big-Data-Umfeld, also für Hadoop, NoSQL-Datenbanken und diverse Arten von Cloud-Speichern. Mit Apache Drill können Nutzer mithilfe von SQL-Abfragen auf nahezu alle derzeit verfügbaren Arten von Datenspeichern zugreifen, die keine eigene SQL-Abfrage-Engine oder Schnittstelle haben.

Schlüsselfunktionen von Drill
  • Unterstützung für dynamische Abfragen auf selbstbeschreibende Daten in Dateiform (wie JSON, Parquet, TXT) und auf MapR-DB/HBase Tabellen, ohne Notwendigkeit, Meta-Data-Definitionen über den Hive-Metastore zu beziehen.
  • Unterstützung für ANSI SQL
  • Unterstützung für eingebettete Daten
  • Integration mit Apache Hive (Abfragen auf Hive Tabellen und Views, Unterstützung für sämtliche Hive-Dateiformate und Hive-UDFs).
  • Unterstützung diverser BI/SQL-Tools, durch Integration von Standard-JDBC/ODBC-Treibern.

Der Allesfresser

Nach Angaben von Jacques Nadeau, Vice President bei Apache Drill, wurde Drill geschaffen, weil die Architektur aktueller relationalen Abfrage-Engines nicht mehr zeitgemäß sei. Die Arbeitsweise von Drill orientiere sich auch an Googles Analysetool Dremel. Drill kann Petabytes an Daten, die über tausende Server verteilt sind, in Sekunden durchsuchen.

Die Architektur von Apache Drill
Die Architektur von Apache Drill
(Apache Software Foundation)

Eine Besonderheit bei Drill ist dabei, dass die Daten nicht in einem vorgegebenen Schema vorliegen müssen, weil Drill die Abfrage im Verlauf der Ausführung an das von Drill erkannte Schema anpasst. Mit anderen Worten: Drill kann Daten direkt aus den jeweiligen Datenspeichern verarbeiten, ohne dass die Nutzer dazu erst ein Datenbankschema definieren oder Daten umwandeln müssten. So kommt Drill beispielsweise auch mit Daten im JSON-Format zurecht, wie sie die diversen NoSQL-Datenbanken liefern.

Neuerungen in Version 1.0

Neu in Version 1.0 sind unter anderen substanzielle Verbesserungen bei Stabilität, Geschwindigkeit und Speicherverwaltung. Ferner haben die Entwickler die CLI-Schnittstelle komfortabler gemacht, unter anderem mit Unterstützung für Shortcuts und Farben. Auch die Dokumentation wurde beträchtlich erweitert und auf den neuesten Stand gebracht, einschließlich zahlreicher Erweiterungen im Bereich der SQL-Referenz.

Dabei wurde auch die Kompatibilität des JDBC-Treibers verbessert, der jetzt auch Direct URLs für den Verbindungsaufbau verwenden kann, ohne Umweg über ZooKeeper. Weitere Details zur neuen Version finden sich in den Release Notes, sowie in der Dokumentation .

Download und Verfügbarkeit

Die Drill-Entwicklung wird von zahlreichen Unternehmen gemeinsam getragen, wobei insbesondere mehrere Hersteller von Business Intelligence Software Partner des Drill-Projektes sind oder eng mit diesem zusammen arbeiten, darunter Information Builders, JReport (Jinfonet Software), MicroStrategy, Qlik, Simba, Tableau und TIBCO. Daher stellt Drill auch ODBC- und JDBC-Treiber für solche SQL-basierten Lösungen zur Verfügung.

Apache Drill 1.0 kann ab sofort von der Projektseite heruntergeladen werden und steht ASF-typisch unter der Apache-Lizenz 2.0.

(ID:43408742)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung