Definition Was ist Apache Superset?

Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Bei Apache Superset handelt es sich um eine Business-Intelligence-Webanwendung. Die Open Source Software ist ein Projekt der Apache Software Foundation und lässt sich zum Untersuchen und Visualisieren großer Datenmengen einsetzen. Sie ist intuitiv bedienbar und bietet viele Darstellungsmöglichkeiten – von einfachen Liniendiagrammen bis zu komplexen räumlichen Diagrammen. Apache Superset steht unter Apache-2.0-Lizenz und unterstützt viele verschiedene Datenbanken.

Firmen zum Thema

(Bild: © aga7ta - stock.adobe.com)

Apache Superset ist der Name einer Software und Plattform, mit der sich Daten untersuchen und visualisieren lassen. Sie eignet sich für große Datenmengen bis in den Petabyte-Bereich und ist als Open Source Software unter Apache-2.0-Lizenz frei verfügbar. Die Software geht auf ein 2015 beim Unternehmen Airbnb gestartetes Projekt zurück. 2017 nahm die Apache Software Foundation (ASF) das Projekt als Inkubator-Projekt auf. Seit dem Jahr 2021 zählt Apache Superset zu den rund 200 Top-Level-Projekten der ASF.

Mit Superset lassen sich Daten aus vielen verschiedenen Quellen und Datenbanken analysieren und die Ergebnisse grafisch aufbereiten. Es werden zahlreiche Typen von SQL- und Cloud-Datenbanken unterstützt. Das Erstellen der Visualisierungen ist nach dem No-Code-Prinzip möglich. Grafikvorlagen und interaktive Dashboards unterstützen den Anwender. Darüber hinaus bietet die Software einen leistungsfähigen SQL-Editor.

Die Software zeichnet sich durch ihre intuitive Bedienbarkeit und ihre hohe Verarbeitungsgeschwindigkeit aus. Sie bietet viele Darstellungsmöglichkeiten, von einfachen Linien- und Kreisdiagrammen bis zu komplexen räumlichen Diagrammen. Weltweit nutzen zahlreiche große Unternehmen wie Airbnb, Dropbox, Netflix, Twitter oder American Express in verschiedenen Anwendungen und Branchen die Business-Intelligence-Webanwendung Apache Superset. Die aktuelle Version der Software (Stand Oktober 2021) ist Apache Superset 1.3.2.

Architektur, Funktionen und unterstützte Datenbanken von Apache Superset

Apache Superset ist von Grund auf Cloud-nativ konzipiert. Die Software lässt sich auf Einzelrechnern und in verteilten Umgebungen einsetzen, skaliert in großem Umfang und ist hochverfügbar installierbar. Darüber hinaus eignet sich Apache Superset für die Ausführung in Containern. Superset arbeitet mit verschiedenen Webservern, Message-Queues, Backends und Caching-Lösungen zusammen. Herunterladen und installieren lässt sich die Software von unterschiedlichen Quellen und über verschiedene Wege. Beispielsweise ist die Software über GitHub verfügbar, kann über das offizielle Software-Repository für Python, den Python Package Index (PyPI), installiert werden oder ist als Docker-Image auf Docker Hub erhältlich.

Eine der hervorstechenden Eigenschaften von Apache Superset ist die Unterstützung von zahlreichen unterschiedlichen Datenbanken und Datenbanktechnologien. Neben der als Bestandteil der Python-Standardbibliothek integrierten Kompatibilität zu SQLite lässt sich die Konnektivität zu vielen anderen Datenbanken über die Installation entsprechender Pakete realisieren. Grundsätzlich kann Apache Superset Daten von beliebigen SQL-Datenbanken mit Python DB-API-Treiber per SQLAlchemy-Dialekt abfragen. Darüber hinaus werden Amazon Redshift, Google Big Query, Apache Druid, Apache Hive, Elasticsearch, Exasol, IBM Db2, Snowflake, Trino, Presto, PostgreSQL, MySQL, IBM Netezza, Apache Kylin, Apache Pinot, MariaDB, Vertica, Oracle, SAP Hana, Apache Solr, Azure MS SQL, ClickHouse, CockroachDB, Hologres, Dremio, Teradata, Firebolt und viele mehr unterstützt.

Bestandteile von Apache Superset sind ein No-Code-Visualization-Builder und ein SQL-Editor für Abfragen und Metadaten-Workflows. Zur Visualisierung sind individuell anpassbare Visualisierungsvorlagen nutzbar. Für den Einsatz in Unternehmen verfügt Apache Superset über Authentifizierungsfunktionen mit Unterstützung von OpenID, LDAP und OAuth und ein rollenbasiertes Nutzerkonzept. Unter anderem sind folgende Rollen in Apache Superset vorgesehen: Administratoren, Alpha User und Gamma User.

Vorteile von Apache Superset

Der Einsatz von Apache Superset zur Untersuchung und Visualisierung von Daten bietet zahlreiche Vorteile. Die Software ist frei verfügbar und steht unter Open-Source-Lizenz. Sie lässt sich für private wie für professionelle Zwecke verwenden. Apache Superset besitzt eine moderne Architektur und ist von Grund auf Cloud-nativ designt. Die Software ist auf einzelnen Rechnern und in verteilten Umgebungen nutzbar. Zudem eignet sie sich für die Ausführung in Containern und skaliert in einem großen Umfang. Weitere Vorteile von Apache Superset sind:

  • hohe Performance – geeignet für große Datenmengen bis in den Petabyte-Bereich
  • integrierte Caching-Ebene zur Optimierung der Performance von Diagrammen und Dashboards
  • hochverfügbar installierbar
  • viele Visualisierungsmöglichkeiten von einfachen Liniendiagrammen bis zu komplexen räumlichen Diagrammen
  • einfache, intuitive Benutzung
  • Erstellen von Visualisierungen ohne Programmcode über den No-Code-Visualization-Builder
  • integrierter SQL-Editor und Unterstützung komplexer SQL-Abfragen
  • Unterstützung einer Vielzahl von Datenbanken und Datenbanktechnologien
  • Konnektivität zu beliebigen SQL-basierten Datenquellen per DB-API-Treiber und SQLAlchemy
  • Erstellen interaktiver Dashboards
  • arbeitet mit verschiedenen Webservern, Message-Queues, Backends und Caching-Lösungen zusammen
  • zahlreiche individuell anpassbare Visualisierungsvorlagen vorhanden
  • Sicherheitsmodell für den Enterprise-Einsatz mit Unterstützung von Authentifizierungsfunktionen und rollenbasiertem Nutzerkonzept
  • einfaches Hinzufügen individueller Visualisierungsmöglichkeiten über Plugin-Konzept
  • Bereitstellung einer API für programmtechnische Zugriffe
  • Unterstützung von Benachrichtigungen und terminierbaren Berichten

(ID:47762223)