Ich finde es oft so, dass ich mit caret
R mehrere verschiedene Vorhersagemodelle trainiere. Ich trainiere sie alle auf den gleichen Kreuzvalidierungsfalten mit caret::: createFolds
und wähle dann das beste Modell basierend auf kreuzvalidierten Fehlern.
Die Medianvorhersage mehrerer Modelle übertrifft jedoch häufig das beste Einzelmodell in einem unabhängigen Testsatz. Ich denke darüber nach, einige Funktionen zum Stapeln / Zusammensetzen von Caret-Modellen zu schreiben, die mit den gleichen Kreuzvalidierungsfalten trainiert wurden, zum Beispiel indem Medianvorhersagen von jedem Modell auf jeder Falte genommen werden oder indem ein "Metamodell" trainiert wird.
Dies kann natürlich eine äußere Kreuzvalidierungsschleife erfordern. Kennt jemand irgendwelche existierenden Pakete / Open-Source-Code zum Zusammenstellen von Caret-Modellen (und möglicherweise zum Kreuzvalidieren dieser Ensembles)?
Was Sie suchen, nennt sich "Modell-Ensemble". Ein einfaches Einführungs-Tutorial mit R-Code finden Sie hier: http://viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.html
quelle
Ich bin mir nicht ganz sicher, wonach Sie suchen, aber das könnte helfen: http://www.jstatsoft.org/v28/i05/paper
So verwenden Sie mehrere Modelle in Caret. Der Teil, der Sie interessieren könnte, ist Abschnitt 5 auf Seite. 13.
quelle