Kommentar von Ralf Klinkenberg, Rapidminer Wo hören BI-Systeme auf und wo beginnt Predictive Analytics?

Autor / Redakteur: Ralf Klinkenberg / Nico Litzel

Advanced Analytics, Predictive Analytics und Business Intelligence (BI) – wo liegen die Unterschiede und wofür eignen sich die einzelnen Verfahren? Antworten hierauf gibt Ralf Klinkenberg, General Manager und Gründer von Rapidminer.

Firmen zum Thema

Der Autor: Ralf Klinkenberg ist General Manager und Gründer von Rapidminer
Der Autor: Ralf Klinkenberg ist General Manager und Gründer von Rapidminer
(Bild: Rapidminer)

Bei Advanced Analytics handelt es sich laut dem im Februar 2014 veröffentlichten Gartner Magic Quadrant for Advanced Analytics Platforms um „die Analyse aller Datenarten unter Verwendung hoch entwickelter quantitativer Methoden – wie etwa Statistik, beschreibendes und prädiktives Data Mining, Simulation und Optimierung – um so Einblicke zu gewähren, deren Entdeckung traditionellen Ansätzen der Business Intelligence (BI) – wie Abfragen und Reporting – wohl kaum zuzutrauen ist.“

Der Begriff „Analytics“ stellt einen großen Bereich mit sehr vielen Unterbereichen dar, sodass es schwerfällt, die große Zahl an Schlagwörtern auseinander zu halten. Grundsätzlich umfasst Analytics die Fertigkeiten, Technologien, Anwendungen und Methoden, welche der ununterbrochenen iterativen Erforschung und Untersuchung von Daten dienen, um Einblicke zu gewinnen und die Unternehmensplanung voranzubringen. Analytics besteht aus zwei Hauptgebieten: Business Intelligence und Advanced Analytics.

Bildergalerie

Business Intelligence: Der Schwerpunkt dieses Bereiches liegt traditionell in der Anwendung einheitlicher Messgrößen, um den bisherigen Erfolg zu messen sowie um die Unternehmensplanung zu lenken. Der Bereich Business Intelligence beinhaltet Abfragen, Reporting und OLAP (Online Analytical Processing) und beantwortet Fragen wie „was ist passiert?“, „wie viele“ und „wie oft“.

Advanced Analytics

Dieser Bereich geht über die Business Intelligence hinaus, indem es aufwendige Modelliertechniken verwendet, um zukünftige Ereignisse zu prognostizieren oder Muster zu entdecken, die sonst nicht ermittelt werden können. Advanced Analytics beantwortet Fragen wie „warum passiert das?“, „was ist, wenn sich diese Tendenzen fortsetzen?“, „was passiert als nächstes?“ (Vorhersage) und „was ist das Beste, was passieren kann?“ (Optimierung).

Business Intelligence

Bei Business Intelligence handelt es sich um eine Reihe von Architekturen und Technologien, die zu Geschäftszwecken Rohdaten in aussagekräftige und nützliche Informationen verwandeln. Grundsätzlich helfen BI-Werkzeuge gewerblichen Anwendern, umfangreiche Daten zu interpretieren. Der BI-Bereich beschäftigt sich vordergründig mit der Speicherung und dem Abruf von Daten aus der Vergangenheit unter Zuhilfenahme von Technologien wie Datenwürfeln und Query-Engines. Die Möglichkeit, den bisherigen Erfolg zu messen, ist in einem komplexen betrieblichen Umfeld von unerlässlicher Bedeutung. Die Ableitung neuer Chancen von bisherigen Daten sowie die Implementierung wirkungsvoller Strategien auf der Grundlage von durch Business Intelligence gewonnenen Erkenntnissen können auf dem Markt Wettbewerbsvorteile verschaffen.

Business Intelligence bezieht sich auch häufig auf die Erstellung und Wartung von Datenlagern, die oft in OLAP-Würfeln gespeichert sind, um ein leistungsfähiges Abfragen und Reporting zu unterstützen. Neben dem Abfragen und der Visualisierung von Daten ermöglichen es traditionelle BI-Umgebungen, regelbasierte Warnmeldungen zu implementieren, um Entscheider über wichtige Ereignisse oder Änderungen zu informieren. Die Aktionen im BI-Bereich werden jedoch immer durch menschliche Interaktion definiert sowie von Menschen durchgeführt.

Advanced Analytics

Der Bereich Advanced Analytics befasst sich mit der automatischen Entdeckung und Kommunikation von aussagekräftigen Mustern in strukturierten sowie in unstrukturierten Daten. Auf dem Gebiet der Advanced Analytics geht man über Business Intelligence hinaus und erweitert den Horizont der traditionellen Analyse. Bei traditionellen Analytics betrachten Analysten die Daten und fragen „was ist passiert?“ Bei Advanced Analytics wird gefragt „was wird passieren?“ Business-Analysten können für ihr Unternehmen Maßnahmen im Voraus ergreifen – ähnlich wie ein Fußballspieler, der dahin läuft, wo der Ball sein wird und nicht dahin, wo der Ball gewesen ist.

Methoden und Technologien, sowohl aus der Statistik als auch aus der Informatik, haben eine wichtige Rolle in der Entwicklung von Advanced Analytics gespielt. Die wichtigsten Beiträge zur Fachdisziplin Advanced Analytics kommen aus den Bereichen Maschinelles Lernen und Data Mining.

Der Bereich Maschinelles Lernen befasst sich mit der umfangreichen und automatisierten Erstellung statistischer Modelle in großen Datensätzen – wobei Hypothesentests entfallen – und ist seit vielen Jahrzehnten ein sehr aktives Forschungsgebiet. Data Mining dagegen hat das Maschinelle Lernen um die notwendigen Schritte der Datenintegration und Vorverarbeitung bereichert, um bessere Modelle erstellen zu können. Beim Maschinellen Lernen liegt der Schwerpunkt auf der Modellierung. Heutzutage wird der Begriff Data Mining seltener verwendet. Unter Analysten wurde dieser Begriff vorwiegend durch solche wie Predictive Analytics, Descriptive Modeling oder andere eng damit verbundene Begriffe wie Text Analytics oder Multimedia Analytics abgelöst.

Predictive Analytics

Predictive Analytics heißt das Verfahren, bei dem Daten analysiert werden, um statistisch genaue Prognosen über zukünftige Ereignisse zu machen. Der Bereich Predictive Analytics umfasst eine Vielzahl von Techniken aus der computerbasierten Statistik, dem Maschinellen Lernen und Data Mining, die aktuelle und historische Gegebenheiten analysieren, um Vorhersagen über künftige oder ansonsten unbekannte Ereignisse zu treffen. In betrieblichen Umgebungen finden und nutzen prädiktive Modelle automatisch in historischen und transaktionalen Daten gefundene Muster, um diese auf zukünftige Ereignisse zu extrapolieren und so die wahrscheinlichste Zukunft vorauszusagen. Modelle, welche diese Muster beschreiben, erfassen die Beziehungen zwischen deutlich mehr Faktoren untereinander als Menschen dazu in der Lage wären. Dies ermöglicht unter anderem die Erkennung bisher unbekannter Risiken und Chancen.

Im Allgemeinen wird der Begriff Predictive Analytics im Sinne von prädiktivem Modellieren verwendet, das heißt, das „Scoring“ neuer und ungesehener Daten anhand von prädiktiven Modellen sowie das Prognostizieren. Der Begriff wird jedoch immer häufiger verwendet, um verwandte analytische Fachdisziplinen zu bezeichnen, wie zum Beispiel die beschreibende Modellierung (Descriptive Modeling) und Entscheidungsmodellierung oder -optimierung. Diese Disziplinen gehen ebenfalls mit einer gründlichen Datenanalyse einher und werden im Business zwecks Segmentierung und Entscheidungsfindung häufig angewendet, wobei sie allerdings unterschiedliche Zwecke und zugrundeliegende statistische Techniken haben. Predictive Analytics ist nur ein Teil des Marktsegments Advanced Analytics.

Analyse jenseits von tabellarischen Daten

Wer als Unternehmer an Daten denkt, denkt meist an eine klassische Datenbank oder aber an ein Tabellenkalkulationsprogramm: Organisierte Zeilen oder Spalten bestehen in der Regel aus Zahlen, aus „tabellarischen Daten.“ Allerdings sind die Daten, die heutzutage erfasst werden, zunehmend unstrukturiert. Weitere Gebiete, die mit dem Bereich Predictive Analytics in Verbindung stehen, sind unter anderem:

  • Text-Analytics, die es Benutzern ermöglicht, Erkenntnisse von unstrukturierten Daten wie Textsammlungen abzuleiten.
  • Multimedia Analytics, bei der ähnliche Technologien eingesetzt werden, um unstrukturierte Daten wie Bilder, Audio oder Video in ein strukturiertes Format umzuwandeln, das als Grundlage für die prädiktive oder beschreibende Analyse verwendet werden kann.

Analytische Modelle, die unstrukturierte Daten verarbeiten können, liefern bessere Prognosen.

Zusammenfassung der Unterschiede zwischen BI und Advanced Analytics

Business Intelligence nutzt Daten aus der Vergangenheit und überlässt es dem Benutzer herausfinden, ob das, was er bereits glaubt, auch zutrifft. Darüber hinaus erfordert es die manuelle Definition von Aktionen durch den Benutzer. Advanced Analytics dagegen nutzt Daten aus der Vergangenheit und findet automatisch versteckte Muster, deren Entdeckung für Menschen zu kompliziert ist. Darüber hinaus ermöglichen sie die automatische Erkennung und Durchführung von optimalen Aktionen.

Mit Advanced Analytics können Anwender eine ganz neue Art von Fragen stellen, die über die Möglichkeiten von Business Intelligence hinausgeht. Während bei Business Intelligence das Hauptaugenmerk auf Reporting und Abfragen liegt, geht es bei Predictive Analytics um die Optimierung, Korrelation und Prognose der sogenannten Next-Best-Action oder der wahrscheinlichsten nächsten Aktion. Mit BI-Systemen lässt sich beispielweise bei der Produktentwicklung folgende Frage beantworten: „Was ist das letzte Mal passiert, als wir ein neues Produkt eingeführt haben?“ Predictive Analytics dagegen ermöglicht dem Unternehmen zu fragen, was für Auswirkungen die Einführung einer neuen Produktreihe auf den Gewinn haben wird.

Während viele Firmen zum wirksamen Einsatz ihrer Datenbestände bereits Business-Intelligence-Anwendungen innerhalb ihrer Geschäftsprozesse verwenden und umsetzen, bleibt das wahre Potenzial von Daten in vielen Unternehmen noch ungenutzt. Advanced Analytics, insbesondere Predictive Analytics, können dabei helfen, die Zukunft zu enthüllen und Geschäftsabläufe zu optimieren.

Artikelfiles und Artikellinks

(ID:42845625)