Aus Robert Kabacoffs Quick-R habe ich
# Bootstrap 95% CI for regression coefficients
library(boot)
# function to obtain regression weights
bs <- function(formula, data, indices) {
d <- data[indices,] # allows boot to select sample
fit <- lm(formula, data=d)
return(coef(fit))
}
# bootstrapping with 1000 replications
results <- boot(data=mtcars, statistic=bs,
R=1000, formula=mpg~wt+disp)
# view results
results
plot(results, index=1) # intercept
plot(results, index=2) # wt
plot(results, index=3) # disp
# get 95% confidence intervals
boot.ci(results, type="bca", index=1) # intercept
boot.ci(results, type="bca", index=2) # wt
boot.ci(results, type="bca", index=3) # disp
Wie kann ich die p-Werte der Bootstrap-Regressionskoeffizienten erhalten?
r
regression
p-value
bootstrap
ECII
quelle
quelle
Antworten:
Nur eine andere Variante, die etwas simpel ist, aber ich denke, die Nachricht zu übermitteln, ohne die Bibliothek explizit zu verwenden
boot
, was einige Leute mit der verwendeten Syntax verwirren kann.Wir haben ein lineares Modell: ,y=Xβ+ϵ ϵ∼N(0,σ2)
Das Folgende ist ein parametrischer Bootstrap für dieses lineare Modell. Das bedeutet, dass wir unsere Originaldaten nicht erneut abtasten, sondern tatsächlich neue Daten aus unserem angepassten Modell generieren. Zusätzlich nehmen wir an, dass die Bootstrap-Verteilung des Regressionskoeffizienten symmetrisch und translatorisch invariant ist. (Sehr grob gesagt, dass wir die Achse davon bewegen können, indem wir ihre Eigenschaften beeinflussen.) Die Idee dahinter ist, dass die Schwankungen in den 'auf und daher bei genügend Proben eine gute Annäherung an die wahre Verteilung liefern sollten von 's. Wie zuvor testen wir erneut und definieren unsere p-Werte alsβ ϵ β H 0 : 0 = β j ββ β ϵ β H0:0=βj "die Wahrscheinlichkeit, dass bei einer Nullhypothese für die Wahrscheinlichkeitsverteilung der Daten das Ergebnis so extrem oder extremer als das beobachtete Ergebnis ist" (wobei die beobachteten Ergebnisse in diesem Fall die vonuns erhaltenenfür unser Originalmodell). Also los geht's:β
Wie bereits erwähnt, ist die ganze Idee, dass Sie die Bootstrap-Verteilung von 's annähernd ihrer wahren haben. (Dieser Code ist eindeutig auf Geschwindigkeit, aber auf Lesbarkeit optimiert. :))β
quelle
Die Community und @BrianDiggs können mich korrigieren, wenn ich falsch liege, aber ich glaube, Sie können einen p-Wert für Ihr Problem wie folgt erhalten. Ein p-Wert für einen zweiseitigen Test ist definiert als
Wenn Sie also die Bootstrap-Koeffizienten nach Größe ordnen und dann die Proportionen größer und kleiner Null bestimmen, sollte das minimale Verhältnis mal zwei einen p-Wert ergeben.
Normalerweise benutze ich in einer solchen Situation die folgende Funktion:
quelle
Der Bootstrap kann zum Berechnen von Werten verwendet werden, erfordert jedoch eine wesentliche Änderung Ihres Codes. Da ich mit RI nicht vertraut bin, kann ich Ihnen nur eine Referenz geben, in der Sie nachschlagen können, was Sie tun müssten: Kapitel 4 von (Davison und Hinkley 1997).p
Davison, AC und Hinkley, DV 1997. Bootstrap-Methoden und ihre Anwendung. Cambridge: Cambridge University Press.
quelle