Ich bin kein Experte für zufällige Gesamtstrukturen, aber ich verstehe klar, dass das Hauptproblem bei zufälligen Gesamtstrukturen die (zufällige) Baumgenerierung ist. Können Sie mir erklären, wie die Bäume entstehen? (dh was ist die verwendete Verteilung für die Baumerzeugung?)
Danke im Voraus !
quelle
Die Hauptidee ist das Absacken der Bäume. Im Einzelnen basiert jeder Baum auf einer Stichprobe von Objekten, die als Ersatz aus dem ursprünglichen Satz gezogen wurden. Somit hat jeder Baum einige Objekte, die er nicht gesehen hat, was das gesamte Ensemble heterogener und damit allgemeiner macht.
Außerdem werden Bäume so geschwächt, dass bei jeder Teilung nur M (oder
mtry
) zufällig ausgewählte Attribute berücksichtigt werden; M ist normalerweise eine Quadratwurzel der Anzahl der Attribute in der Menge. Dies stellt sicher, dass die Bäume weniger überpasst werden, da sie nicht beschnitten werden. Weitere Details finden Sie hier .Auf der anderen Seite gibt es eine Variante von RF genannt Extremem Zufall Wald, in denen Bäume in zufälliger Art und Weise hergestellt werden (es gibt keine Optimierung von Splits) - konsultieren, ich denke , diese Referenz .
quelle