Da die Regressionsmodellierung oft mehr "Kunst" als Wissenschaft ist, teste ich häufig viele Iterationen einer Regressionsstruktur. Wie lassen sich die Informationen aus diesen mehreren Modellläufen auf effiziente Weise zusammenfassen, um das "beste" Modell zu finden? Ein Ansatz, den ich gewählt habe, besteht darin, alle Modelle in eine Liste aufzunehmen und summary()
diese Liste zu durchlaufen, aber ich kann mir vorstellen, dass es effizientere Vergleichsmöglichkeiten gibt.
Beispielcode & Modelle:
ctl <- c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
trt <- c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
group <- gl(2,10,20, labels=c("Ctl","Trt"))
weight <- c(ctl, trt)
lm1 <- lm(weight ~ group)
lm2 <- lm(weight ~ group - 1)
lm3 <- lm(log(weight) ~ group - 1)
#Draw comparisions between models 1 - 3?
models <- list(lm1, lm2, lm3)
lapply(models, summary)
r
regression
Verfolgungsjagd
quelle
quelle
Antworten:
Plotten Sie sie!
http://svn.cluelessresearch.com/tables2graphs/longley.png
Oder, wenn Sie müssen, verwenden Sie Tabellen: Das apsrtable- Paket oder die
mtable
Funktion im memisc- Paket.Verwenden
mtable
quelle
grid
nichtlattice
:)memisc
vorher nicht kannte , sieht aus wie ein sehr praktisches Paket, das man im Köcher hat!Das Folgende beantwortet die Frage nicht genau. Es kann Ihnen jedoch einige Ideen geben. Dies habe ich kürzlich getan, um die Anpassung mehrerer Regressionsmodelle mithilfe von ein bis vier unabhängigen Variablen zu bewerten (die abhängige Variable befand sich in der ersten Spalte des df1-Datenrahmens).
Der Inhalt von as.character (Formularliste) war
Dann habe ich einige nützliche Indizes gesammelt
Der endgültige Datenrahmen war
Schließlich ein Cp-Plot (mit Bibliothek wle)
quelle