Kann ein Random Forest trainiert werden, um die Zähldaten angemessen vorherzusagen? Wie würde das gehen? Ich habe einen ziemlich großen Wertebereich, daher ist eine Klassifizierung nicht wirklich sinnvoll. Wenn ich die Regression verwenden würde, würde ich die Ergebnisse einfach abschneiden? Ich bin hier ziemlich verloren. Irgendwelche Ideen?
r
regression
random-forest
prediction
count-data
JEquihua
quelle
quelle
Antworten:
Es gibt ein R-Paket mit dem Namen,
mobForest
das für die Zähldaten in eine echte Zufallsgesamtstruktur passen kann. Es basiert auf dermod()
(modellbasierten rekursiven Partitionierung) imparty
Paket. Es führt eine Poisson-Regression durch, wenn dasfamily
Argument als angegeben istpoisson()
. Das Paket befindet sich nicht mehr im CRAN-Repository, früher verfügbare Versionen können jedoch aus dem Archiv bezogen werden.Wenn Sie nicht auf zufällige Gesamtstruktur- / Absackvorgänge beschränkt sind, steht auch eine Boost-Version für die Zähldaten zur Verfügung. Das heißt
gbm
(verallgemeinerte verstärkte Regressionsmodelle). Es kann auch ein Poisson-Modell passen.quelle
Ich sehe ein paar Möglichkeiten.
quelle
Nun, es ist keine zufällige Gesamtstruktur , aber CatBoost unterstützt eine Poisson-Verlust-Funktion, die für die Zählung von Regressionen mit verstärkten Bäumen verwendet werden kann:
https://tech.yandex.com/catboost/doc/dg/concepts/loss-functions-docpage/
quelle