Ich habe die folgenden Daten hier . Ich versuche, das 95% -Konfidenzintervall für die mittlere Reinheit zu berechnen, wenn der Kohlenwasserstoffprozentsatz 1,0 beträgt. In R gebe ich Folgendes ein.
> predict(purity.lm, newdata=list(hydro=1.0), interval="confidence", level=.95)
fit lwr upr
1 89.66431 87.51017 91.81845
Wie kann ich dieses Ergebnis jedoch selbst ableiten? Ich habe versucht, die folgende Gleichung zu verwenden.
Und ich gebe folgendes in R ein.
> SSE_line = sum((purity - (77.863 + 11.801*hydro))^2)
> MSE = SSE_line/18
> t.quantiles <- qt(c(.025, .975), 18)
> prediction = B0 + B1*1
> SE_predict = sqrt(MSE)*sqrt(1+1/20+(mean(hydro)-1)^2/sum((hydro - mean(hydro))^2))
> prediction + SE_predict*t.quantiles
[1] 81.80716 97.52146
Meine Ergebnisse unterscheiden sich von der Vorhersagefunktion von R. Was missverstehe ich über Vorhersageintervalle?
r
regression
confidence-interval
prediction-interval
idealistikz
quelle
quelle
predict(purity.lm, newdata=list(hydro=1.0), interval="prediction", level=.95)
Antworten:
Ihr
predict.lm
Code berechnet Konfidenzintervalle für die angepassten Werte. Ihre Handberechnung berechnet Vorhersageintervalle für neue Daten. Wenn Sie das gleiche Ergebnis erzielen möchten,predict.lm
das Sie aus der Handberechnung erhalten haben, wechseln Sieinterval="confidence"
zuinterval="prediction"
quelle
Gute Antwort von dpel. Ich würde hinzufügen, dass der Unterschied zwischen Konfidenzintervall und Vorhersageintervall wie folgt angegeben werden kann:
Quelle Siehe Folie Seite 5/17 und 11/17
quelle