Nehmen wir das folgende Beispiel:
set.seed(342)
x1 <- runif(100)
x2 <- runif(100)
y <- x1+x2 + 2*x1*x2 + rnorm(100)
fit <- lm(y~x1*x2)
Dies erstellt ein Modell von y basierend auf x1 und x2 unter Verwendung einer OLS-Regression. Wenn wir y für ein gegebenes x_vec vorhersagen möchten, könnten wir einfach die Formel verwenden, die wir aus dem erhalten summary(fit)
.
Was aber, wenn wir die unteren und oberen Vorhersagen von y vorhersagen wollen? (für ein gegebenes Konfidenzniveau).
Wie würden wir dann die Formel erstellen?
r
regression
predictive-models
prediction-interval
Tal Galili
quelle
quelle
Antworten:
Sie benötigen eine Matrixarithmetik. Ich bin mir nicht sicher, wie Excel damit umgehen wird. Wie auch immer, hier sind die Details.
Angenommen , Ihre Regression geschrieben wird als .y = X β+ e
Sei ein Zeilenvektor, der die Werte der Prädiktoren für die Vorhersagen enthält (im selben Format wie X ). Dann wird die Prognose gegeben durch y = X * β = X * ( X ' X ) - 1 X ' Y mit einer zugehörigen Varianz σ 2 [ 1 + X * ( X ' X ) - 1 ( X * ) ' ] .X∗ X
quelle
Sind Sie zufällig nach den verschiedenen Arten von Vorhersageintervallen? Die
predict.lm
Manpage hatund
Ist es das, was du im Sinn hattest?
quelle
@Tal: Könnte ich Kutner et al. Als hervorragende Quelle für lineare Modelle vorschlagen?
quelle