Kalibrierte verstärkte Entscheidungsbäume in R oder MATLAB

8

In einem empirischen Vergleich von überwachten Lernalgorithmen (ICML 2006) bewerteten die Autoren (Rich Caruana und Alexandru Niculescu-Mizil) mehrere Klassifizierungsalgorithmen (SVMs, ANN, KNN, zufällige Wälder, Entscheidungsbäume usw.) und berichteten, dass kalibrierte Boosted-Bäume Rang als bester Lernalgorithmus insgesamt über acht verschiedene Metriken (F-Score, ROC-Bereich, durchschnittliche Präzision, Kreuzentropie usw.).

Ich möchte kalibrierte Boosted-Decision-Bäume in einem meiner Projekte testen und habe mich gefragt, ob jemand ein gutes R-Paket oder eine MATLAB-Bibliothek dafür vorschlagen kann.

Ich bin relativ neu in R, obwohl ich große Erfahrung mit MATLAB und Python habe. Ich habe über Rs gbm , tree und rpart gelesen , bin mir aber nicht sicher, ob diese Pakete kalibrierte Boosted-Decision-Bäume implementieren oder ob es andere gibt, die sie implementieren.

Vielen Dank

Amelio Vazquez-Reina
quelle

Antworten:

3

Über R würde ich für das gbm- Paket stimmen ; Es gibt eine Vignette, die einen guten Überblick bietet: Generalized Boosted Models: Eine Anleitung zum gbm-Paket . Wenn Sie nach einer einheitlichen Schnittstelle zu ML-Algorithmen suchen, empfehle ich das Caret- Paket mit integrierten Funktionen für die Datenvorverarbeitung, das Resampling und die vergleichende Bewertung der Modellleistung. Weitere Pakete für geboostete Bäume sind in Tabelle 1 einer der zugehörigen Vignetten-, Modelloptimierungs-, Vorhersage- und Leistungsfunktionen aufgeführt . Im JSS-Papier , S. 10-11, finden Sie auch ein Beispiel für die Parametereinstellung für verstärkte Bäume .

Hinweis: Ich habe nicht überprüft, aber Sie können auch in Weka schauen (es gibt eine R-Schnittstelle, RWeka ).

chl
quelle
1
Danke @chl. Ich werde sie mir ansehen. Wissen Sie, ob eines dieser Pakete kalibrierte Ausgänge bietet? (dh kalibrierte Wahrscheinlichkeiten, anstatt nur Punkte)
Amelio Vazquez-Reina
1
Ich verstand die Frage wie folgt: "Wurden in R Plattierungsskalierungs- oder isotonische Regressionsmethoden implementiert?"
Charles
@ user023472 Haben Sie jemals eine Antwort auf dieses Problem gefunden?
Charles