Nach meinem eigenen Verständnis bin ich daran interessiert, die Berechnung der Standardfehler der geschätzten Koeffizienten manuell zu wiederholen, da sie beispielsweise mit der Ausgabe der lm()
Funktion einhergehen R
, diese aber nicht festhalten können. Was ist die Formel / Implementierung verwendet?
114
Antworten:
Das lineare Modell wird als Dabei bezeichnet den Vektor der Antworten, den Vektor der Parameter für feste Effekte, die entsprechende Entwurfsmatrix, deren Spalten die Werte der erklärenden Variablen sind, und ist der Vektor zufälliger Fehler. Y β X ε
Es ist bekannt, dass eine Schätzung von gegeben ist durch (siehe z. B. den Wikipedia-Artikel ) Also [Erinnerung: , für einen zufälligen Vektor und eine nicht zufällige Matrix ]& bgr; = ( X ' X ) - 1 X ' y . Var ( β ) = ( X ' X ) - 1 X 'β
so dass wobei durch den Mean Square Error (MSE) in der ANOVA-Tabelle erhalten werden kann.
Beispiel mit einer einfachen linearen Regression in R
Wenn es eine einzelne erklärende Variable gibt, reduziert sich das Modell auf und so dass und Formeln werden transparenter. Beispielsweise ist der Standardfehler der geschätzten Steigung
quelle
lm.fit
/summary.lm
jedoch ausDie Formeln hierfür finden Sie in jedem Zwischentext zur Statistik, insbesondere finden Sie sie in Sheather (2009, Kapitel 5) , aus dem auch die folgende Übung stammt (Seite 138).
Der folgende R-Code berechnet die Koeffizientenschätzungen und ihre Standardfehler manuell
was die Ausgabe erzeugt
Vergleichen Sie mit der Ausgabe von
lm()
:was die Ausgabe erzeugt:
quelle
solve()
Funktion. Dies wäre ohne die Matrixalgebra viel länger. Gibt es eine prägnante Möglichkeit, diese bestimmte Zeile nur mit Basisoperatoren auszuführen?Ein Teil von Ocrams Antwort ist falsch. Tatsächlich:
Der Kommentar der ersten Antwort zeigt, dass weitere Erklärungen zur Varianz des Koeffizienten erforderlich sind:
Bearbeiten
Danke, ich habe den Hut auf dieser Beta zu ignoriert. Der obige Abzug ist . Das richtige Ergebnis ist:wrongly wrong
1.(Um diese Gleichung zu erhalten, setzen Sie die Ableitung erster Ordnung von auf auf Null, um zu maximieren. )β^=(X′X)−1X′y. SSR β SSR
2.E(β^|X)=E((X′X)−1X′(Xβ+ϵ)|X)=β+((X′X)−1X′)E(ϵ|X)=β.
3.Var(β^)=E(β^−E(β^|X))2=Var((X′X)−1X′ϵ)=(X′X)−1X′σ2IX(X′X)−1=σ2(X′X)−1
Hoffentlich hilft es.
quelle