Suchen

Definition Was ist ein Quantile Random Forest?

| Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Ein Quantile Random Forest ist eine spezielle Form des Random Forests. Er kommt für Klassifizierungs- und Regressionsaufgaben zum Einsatz und wird häufig im Umfeld des Machine Learnings verwendet. Das Besondere am Quantile Random Forest ist, dass Vorhersagen bezüglich verschiedener Quantile möglich werden. Es ist abschätzbar, ob vorhergesagte Werte bestimmte Schwellwerte erreichen.

Firmen zum Thema

(Bild: © aga7ta - stock.adobe.com )

Der Quantile Random Forest ist eine Sonderform des Random Forests. Random Forest lässt sich mit „Zufallswald“ übersetzen. Es handelt sich um einen Algorithmus, der für Klassifizierungs- und Regressionsaufgaben einsetzbar ist. Typischer Anwendungsbereich ist das Machine Learning. Das Besondere am Quantile Random Forest ist, dass Vorhersagen bezüglich verschiedener Quantile möglich werden. Ein Quantil ist ein Begriff aus der Statistik und bezeichnet einen bestimmten Schwellwert.

Mithilfe des Zufallswalds aus Entscheidungsbäumen lässt sich abschätzen, ob Vorhersagewerte in bestimmten Schwellwertbereichen liegen. Geprägt hat den Begriff Nicolai Meinshausen von der ETH Zürich in seinen Arbeiten zu Quantile Regression Forests (QRF).

Grundlagen zum Random Forest

Zum besseren Verständnis des Quantile Random Forests zunächst ein grundsätzlicher Überblick zu den Charakteristika und zur Funktionsweise des Random Forests. Der Random-Forest-Algorithmus wird für Klassifizierungs- und Regressionsaufgaben eingesetzt, erzielt in kurzen Trainingszeiten gute Lernergebnisse und ist relativ einfach. Er zählt zu den überwachten Lernverfahren (Supervised Learning). Um bestmögliche Vorhersagen zu ermöglichen, nutzt er die Ergebnisse einer Vielzahl verschiedener einzelner Entscheidungsbäume.

Ein Algorithmus gibt vor, wie und mit welcher Tiefe die Entscheidungsbäume zu generieren sind. Jeder Baum für sich trifft seine Entscheidungen und repräsentiert ein eigenes einfaches Modell. Mit den einzelnen unkorreliert nach dem Zufallsprinzip erstellten Entscheidungsbäumen wird ein „Wald“ gebildet. Mithilfe spezieller Ensemble-Methoden werden die Bäume zum Forest kombiniert, um das Gesamtergebnis zu erhalten. Aus der Menge der Einzelentscheidungen erzeugt ein Algorithmus eine endgültige Entscheidung. Es existieren verschiedene Methoden zur Randomisierung der Entscheidungsbäume.

Das Quantil

Das Quantil ist ein Begriff aus der Statistik. Es handelt sich um einen Schwellenwert, mit dem sich die Verteilung von Werten näher bestimmen lässt. So liegt ein Teil der Werte unterhalb eines gewählten Quantils und ein anderer Teil oberhalb. Mithilfe eines Quantils sind Aussagen möglich wie, 25 Prozent einer betrachteten Menge erfüllen ein bestimmtes Kriterium, 75 Prozent nicht. Die Quantile selbst können unterschiedlich gewählt werden. Es gibt sogenannte Terzile, Quartile, Quintile, Dezile, Perzentile und andere. Ein Terzil ist ein Drittel (33 %), ein Quartil ein Viertel (25 %), ein Quintil ein Fünftel (20 %), ein Dezil ein Zehntel (10 %) und ein Perzentil ein Hundertstel (1 %).

Der Quantile Random Forest näher betrachtet

Ein normaler Random Forest liefert ein Ergebnis Y für eine bestimmte Frage X. Der Quantile Random Forest unterscheidet sich dadurch, dass nicht ein bestimmtes Ergebnis Y ausgegeben wird, sondern die Verteilung der Werte innerhalb vorgegebener Quantile. Der Algorithmus liefert quasi Wahrscheinlichkeiten dafür, dass die Ergebnisse Y oberhalb oder unterhalb eines Quantils liegen. Während ein normaler Random Forest nur den Durchschnitt der Ergebnisse behält und alle anderen Informationen vernachlässigt, stellt der Quantile Random Forest alle Ergebnisse zur Verfügung und zeigt deren quantile Verteilung. Dadurch wird es möglich, Unsicherheiten bezüglich der Ausgangsbedingungen besser in die Vorhersagen zu integrieren.

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de (ID: 46575583)

Über den Autor