Suchen

Die Schönheit der Zahlen Big Data ins Visier genommen

| Autor / Redakteur: Filipe Pereira Martins und Anna Kobylinska / Nico Litzel

Die Erkenntnisse, die in Big Data schlummern, lassen sich am schnellsten und eindrucksvollsten mit Visualisierungswerkzeugen ans Tageslicht bringen. Wer ein Argument auf den Punkt bringen möchte, hat sicherlich schon mal die Erfahrung gemacht: Ein Bild – oder Video – sagt mehr als tausend Datenpunkte.

Firmen zum Thema

Nicht so die große Kunst der Visualisierung, dafür aber zumindest handfeste Erkenntnisse: Gartners Magic Quadrant for Analytics und BI Platforms 2020 krönt Microsoft, Tableau sowie (mit Abstand) Qlik und ThoughtSpot zu den Marktführern.
Nicht so die große Kunst der Visualisierung, dafür aber zumindest handfeste Erkenntnisse: Gartners Magic Quadrant for Analytics und BI Platforms 2020 krönt Microsoft, Tableau sowie (mit Abstand) Qlik und ThoughtSpot zu den Marktführern.
(Bild: Gartner)

Wer einen Sachverhalt im Detail erkunden oder erklären möchte, ist mit einer (interaktiven) Visualisierung generell besser bedient als mit einer Datentabelle. Wer dem Gedächtnis auf die Sprünge helfen will, möchte meist lieber ein Diagramm sehen als eine Reihe. Auch ist das Fachwissen aus dem Bereich der Datenanalyse nicht überall stark ausgeprägt.

Wenn mit reinen Zahlen nichts zu wollen ist

Eine aussagekräftige Visualisierung ist noch aus einem anderen Grunde von entscheidender Bedeutung: Denn grundlegende statistische Eigenschaften können selbst gewiefte Datenanalysten in die Irre führen, da sie mögliche Ursachen der Zusammenhänge nicht aufzeigen können. Der englische Statistiker Francis Anscombe hat genau diesen Tatbestand lange vor dem Aufkommen von Big Data, bereits im Jahre 1973, mit dem sogenannten Anscombe-Quartett nachgewiesen. Und im Jahre 2016 hat der spanische Datenwissenschaftler Alberto Cairo an der Universität in Miami im Experiment DataSaurus den Effekt von Zahlen und einprägsamen Visualisierungen nachgewiesen.

Beim Anscombe-Quartett handelt es sich um vier künstliche Datensätze mit je elf Datenpunkten. Allen vier Datensätzen sind sechs statistische Größen gemeinsam: Mittelwert beider Variablen, Varianz, Korrelation und lineare Regression. Anhand von diesen sechs Eigenschaften sind die vier Datenmengen nicht zu unterscheiden. Wer die Datensätze jedoch visualisiert, kann sofort erkennen, dass es sich um sehr unterschiedliche Datenmuster handelt, die ganz verschiedene Zusammenhänge beschreiben.
Beim Anscombe-Quartett handelt es sich um vier künstliche Datensätze mit je elf Datenpunkten. Allen vier Datensätzen sind sechs statistische Größen gemeinsam: Mittelwert beider Variablen, Varianz, Korrelation und lineare Regression. Anhand von diesen sechs Eigenschaften sind die vier Datenmengen nicht zu unterscheiden. Wer die Datensätze jedoch visualisiert, kann sofort erkennen, dass es sich um sehr unterschiedliche Datenmuster handelt, die ganz verschiedene Zusammenhänge beschreiben.
(Bild: Anscombe's quartet 3.svg / Anscombe's quartet 3.svg / Schutz / CC BY-SA 3.0 / CC BY-SA 3.0)

Es ist daher sehr empfehlenswert, bereits während der explorativen Phase eines Datenanalyseprojekts leistungsstarke Visualisierungen ins Auge zu fassen, statt „nur“ auf vermeintlich altbewährte Maßzahlen zu vertrauen.

Wer die Lücke zwischen Daten, Erkenntnissen, Entscheidungen und Maßnahmen schließen will, greift auf interaktive Visualisierer zurück. BigData-Insider hat die drei interessantesten Lösungen zur Echtzeit-Visualisierung von Big Data untersucht und berichtet, was sie leisten.

Microsoft Power BI

Microsofts Power BI gilt als das führende Werkzeug der Big-Data-Visualisierung schlechthin. Es ist Teil der Power Platform von Microsoft, dem marktführenden Ökosystem von Werkzeugen zur Datenanalyse. Sie umfasst neben dem Flaggschiff der Datenanalyse Power BI einen App-Generator namens Power Apps mit Fähigkeiten zur fortgeschrittenen Datenvisualisierung, einen Automatisierer von organisatorischen Prozessen namens Power Automate und ein Entwicklungswerkzeug für Chatbots, Power Virtual Agents. So können Unternehmen aus ihren Daten konkret umsetzbare Erkenntnisse nicht „nur“ gewinnen, sondern auch in die Tat umsetzen.

Zur Förderung einer Datenkultur in Unternehmen investiert Microsoft erhebliche Mühe in die kontinuierliche Weiterentwicklung von Power BI. Diese konzentriert sich neuerdings auf drei Schlüsselbereiche:

  • KI-getriebene und – in Microsoft eigenen Worten „beeindruckende“ – „Datenerlebnisse“,
  • „moderne Enterprise-BI“ (was auch immer damit gemeint sein mag) sowie
  • Einblicke in unternehmensinterne Entscheidungsprozesse.

Ein Dashboard in Power BI, dem Flaggschiff der Business Intelligence aus dem Hause Microsoft
Ein Dashboard in Power BI, dem Flaggschiff der Business Intelligence aus dem Hause Microsoft
(Bild: Microsoft)

Der Power-BI-Dienst integriert sich mit Azure Synapse, einer Cloud-nativen Big-Data-Analyseplattform mit der Fähigkeit, Data-Lake- und Data-Warehousing-Dienste von „unbeschränkter Skalierbarkeit“ bereitzustellen sowie Daten für BI- und maschinelle Lernanforderungen aufzubereiten. Azure Synapse ist eine Weiterentwicklung von SQL Data Warehouse. Im Web-Portal Azure Synapse Studio können Unternehmen semantische Modelle und interaktive Power BI-Berichte zur Visualisierung von Daten und Analyseerkenntnissen entwickeln.

In seinem neuesten Marktforschungsbericht, Gartner Magic Quadrant for Analytics und BI Platforms 2020, haben Gartner-Analysten Microsoft als den mit Abstand wichtigsten „Leader“ im Markt für Lösungen zur Datenanalyse und Business Intelligence identifiziert.

Salesforce Tableau

Ein Dashboard von Tableau mit einer Übersicht von Visualisierungen zeigt die Vielseitigkeit möglicher Darstellungsformen.
Ein Dashboard von Tableau mit einer Übersicht von Visualisierungen zeigt die Vielseitigkeit möglicher Darstellungsformen.
(Bild: Tableau)

Tableau Software ist ein Hersteller von Visualisierungs-Software mit Sitz im US-Bundesstaat Washington an der pazifischen Westküste der Vereinigten Staaten. Seit dem 1. August des vergangenen Jahres (2019) gehört das Unternehmen zu Salesforce und damit zur Oracle-Gruppe. Seit dem Abschluss der Übernahme hat Salesforce zwei vergleichbare Big-Data-Plattformen im Köcher, die es bisher nicht integrieren konnte: Tableau und die hauseigene Einstein Analytics.

Die Qlik-Plattform von Qlik

Qlik ist das Produktportfolio der QlikTech International, eines Anbieters von Business Intelligence mit Sitz in Radnor im US-Bundesstaat Pennsylvania und einer deutschen Niederlassung in Düsseldorf. Es umfasst Produkte zur Datenanalyse, Datenintegration und Entwicklung. Mit Qlik Sense hat das Unternehmen eine vollständige Data Analytics Platform im Köcher. Im Herzen von Qlik werkelt eine patentierte Associative Engine mit der Fähigkeit zu In-Memory-Datenverarbeitung.

Eine Beispielvisualisierung in QlikView
Eine Beispielvisualisierung in QlikView
(Bild: Qlik)

Qlik will den Nutzern helfen, eine „gezielte, hoch effiziente KPI-Strategie“ aufzubauen, damit sich die Entscheidungsträger „von nichtssagenden Daten nicht ausbremsen lassen“ müssen, und stattdessen „schneller Mehrwert schaffen“. Mit den multi-cloudbasierten End-to-End-Lösungen für Datenintegration und Analyse werden aus Rohdaten überzeugende Visualisierungen und damit Erkenntnisse und Ergebnisse.

QlikView zählt zu den am schnellsten wachsenden Tools für Business Intelligence und Datenvisualisierung. Es bietet unter anderem eine assoziative Suche, mit der sich die Entscheidungsfindung besonders unkompliziert gestalten soll. Das Werkzeug ist Home-Office-freundlich, indem es die Fernarbeit im Team in Echtzeit unterstützt und mit fortgeschrittenen Sicherheitsfeatures trumpft.

Gartner ernannte Qlik zu einem der „Leader“ im Gartner Magic Quadrant for Analytics und BI Platforms 2020. Qlik kann unter anderem auf so prominente Nutzer wie PayPal, Deloitte und Ford verweisen.

Fazit

Datenvisualisierungen wecken das Interesse eines Entscheidungsträgers viel eher als reine Zahlen.

(ID:46861510)