Suchen

Zugriff auf HBase-Tabellen und verbesserte JDBC-Treiber Apache Software Foundation veröffentlicht Tajo 0.10

| Autor / Redakteur: Dipl. -Ing. Thomas Drilling / Nico Litzel

Die Apache Software Foundation hat die Verfügbarkeit der Version 0.10.0 von Apache Tajo bekannt gegeben, einer Data-Warehouse-System-Lösung für Hadoop.

Firma zum Thema

Big Data Warehousing mit Tajo 0.10.0
Big Data Warehousing mit Tajo 0.10.0
(Bild: Apache Software Foundation)

Tajo 0.10.0 bringt zahlreiche neue Funktionen mit, unter anderem einen verbesserten JDBC-Treiber (Java Database Connectivity), eine direkte Unterstützung von JSON-Dateien und Support für Oracle- und PostgreSQL-Catalog-Stores.

Apache Tajo ist ein verteiltes, relationales Data-Warehouse-System für Hadoop. Tajo eignet sich in erster Linie für skalierbare Ad-hoc-Queries mit geringen Latenzzeiten, für Online-Aggregation und für ETL-Prozesse (Extract, Transfer, Load). Anders ausgedrückt: Tajo kann ETL-Operationen auf Daten durchführen, beispielsweise in HDFS gespeichert sind.

Was ist Apache Tajo

Tajo wurde im Frühjahr 2013 in den Inkubator der Apache Software Foundation aufgenommen und konnte schon ein Jahr später mit Version Version 0.8.0 zum Top-Level-Projekt aufsteigen. Die Big-Data-Warehousing-Lösung ist technologisch von MapReduce, Dryad, Dremel, Scope und parallelen Datenbanken beeinflusst. Tajo verwendet das Dateisystem HDFS (Hadoop Distributed File System) als primäre Speicherebene, bringt aber eine eigene Query-Engine mit. Tajo ist kompatibel mit dem ANSI/ISO-SQL-Standard, bietet Support für Hive MetaStore Access und bringt JDBC-Treiber mit, die in der jetzt vorliegenden Version 0.10 noch einmal verbessert wurden. Tajo unterstützt zudem diverse Dateiformate, darunter CSV, JSON, RCFile, SequenceFile und Parquet.

Vereinfachte Integration von JDBC Anwendungen

Die jetzt veröffentlichte Version 0.10 wartetet mit mehreren Dutzend neuer Funktionen und über 150 Fehlerkorrekturen auf, die sich im Detail den Release Notes entnehmen lassen.

Die Highlights unter den Neuerungen: Dank HBase-Speicherintegration können Tajo-Anwender jetzt direkt auf HBase-Tabellen zugreifen. Der verbesserte Java-Database-Connectivity-Treiber soll zudem die Verwendung von JDBC-Anwendungen nach Aussage von Hyunsik Choi, dem stellvertretenden Vorsitzenden des Tajo-Projekts, deutlich vereinfachen. Dies soll nicht mehr komplizierter sein, als der Zugriff auf herkömmliche relationale Datenbanksysteme.

Darüber hinaus haben die Entwickler auch die Unterstützung für Amazon-S3-Storage optimiert, die laut Jihood Son, Mitglied des Tajo-Projektmanagementkomitees, bemerkenswerteste neue Funktion von Tajo 0.10.0. Tajo 0.10 bietet zudem jetzt einen Query History Persistency Manager.

(ID:43256949)

Über den Autor

Dipl. -Ing. Thomas Drilling

Dipl. -Ing. Thomas Drilling

IT-Consultant, Trainer, Freier Journalist