Diese Frage bezieht sich nicht speziell auf R
, aber ich habe sie gewählt, um sie R
zu veranschaulichen.
Betrachten Sie den Code zum Erzeugen von Konfidenzbändern um eine (normale) qq-Linie:
library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")
Ich suche nach einer Erklärung (oder alternativ nach einem Link zu einem Papier- / Online-Dokument, das erklärt), wie diese Vertrauensbereiche aufgebaut sind (ich habe einen Verweis auf Fox 2002 in den Hilfedateien von R gesehen, aber leider habe ich dies nicht Buch handlich).
Meine Frage wird anhand eines Beispiels präzisiert. Hier R
erfahren Sie, wie diese speziellen CIs berechnet werden (ich habe den Code, in dem sie verwendet werden, verkürzt / vereinfacht car::qqPlot
).
x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n) #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")
Die Frage ist: Was ist die Rechtfertigung für die Formel zur Berechnung dieser SE (z SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)
. B. die Linie ).
FWIW diese Formel unterscheidet sich sehr von der Formel der üblichen Konfidenzbänder in der linearen Regression
quelle
Antworten:
Wie COOLSerdash in Kommentaren erwähnt, schreibt John Fox [1] auf den Seiten 35-36:
[1] Fox, J. (2008),
Applied Regression Analysis and Generalized Linear Models, 2nd Ed.,
Sage Publications, Inc
quelle