Was ist die Interpretation der Kovarianz von Regressionskoeffizienten?

13

Die lm-Funktion in R kann die geschätzte Kovarianz von Regressionskoeffizienten ausgeben. Was geben uns diese Informationen? Können wir das Modell jetzt besser interpretieren oder Probleme diagnostizieren, die im Modell vorhanden sein könnten?

mss
quelle
1
Dieselbe Interpretation wie alle anderen Kovarianzen - lineare Kovariation? Die Hauptverwendung besteht darin, die Varianz ausgewählter interessierender Kontraste zu berechnen, beispielsweise um Kontraste zu testen.
kjetil b halvorsen

Antworten:

19

Die grundlegendste Verwendung der Kovarianzmatrix besteht darin, die Standardfehler von Regressionsschätzungen zu erhalten. Wenn der Forscher nur an den Standardfehlern der einzelnen Regressionsparameter selbst interessiert ist, kann er einfach die Quadratwurzel der Diagonale ziehen, um die einzelnen Standardfehler zu erhalten.

Es kann jedoch vorkommen, dass Sie an einer linearen Kombination von Regressionsparametern interessiert sind. Wenn Sie beispielsweise eine Indikatorvariable für eine bestimmte Gruppe haben, ist möglicherweise der Gruppenmittelwert für Sie von Interesse

β0+βgrp .

Dann müssten Sie den Standardfehler für den geschätzten Mittelwert dieser Gruppe ermitteln

XSX ,

Dabei ist ein Vektor Ihrer Kontraste und die Kovarianzmatrix. Wenn wir in unserem Fall nur die Additionskovariate "grp" haben, dann ist ( für den Achsenabschnitt , für die Zugehörigkeit zur Gruppe).S X = ( 1 , 1 ) 1 1XSX=(1,1)11

Darüber hinaus kann die Kovarianzmatrix (oder darüber hinaus die Korrelationsmatrix, die eindeutig aus der Kovarianzmatrix identifiziert wird, aber nicht umgekehrt) für bestimmte Modelldiagnosen sehr nützlich sein. Wenn zwei Variablen stark korrelieren, kann man sich vorstellen, dass das Modell Probleme hat, herauszufinden, welche Variable für einen Effekt verantwortlich ist (weil sie so eng miteinander verbunden sind). Dies kann in einer Vielzahl von Fällen hilfreich sein, z. B. bei der Auswahl von Teilmengen von Kovariaten, die in einem Vorhersagemodell verwendet werden sollen. Wenn zwei Variablen stark korreliert sind, möchten Sie möglicherweise nur eine der beiden in Ihrem Vorhersagemodell verwenden.

Cliff AB
quelle
Vielen Dank für die Erklärung. In Ihrem letzten Absatz beschreiben Sie die Probleme, die auftreten können, wenn unabhängige Variablen stark kollinear sind. Es scheint , als wäre es einfacher, an der Kovarianz / Korrelation der tatsächlichen aussehen s als β s. V a r ( β ) = E ( ε 2 ) ( X ' X ) - 1 gibt es eine inverse in der Formel. Xβ
Var(β^)=E(ε^2)(XX)1
mss
8

Es gibt zwei Arten von Regressionskoeffizienten:

  1. βc
  2. bβ^c

XY|Cov(X,Y)|XYXY

bb1b2b1b2b1b2

b1b1

Cov(b1,b2)

Die Antwort von Cliff AB ist eine gute Zusammenfassung dessen, wofür dies tatsächlich verwendet wird.

Shadowtalker
quelle
bibjij
1
@whuber danke, und ich habe tatsächlich "Korrelation" an einem Punkt geschrieben. Ich
räume
Da ich es vielleicht eine Weile nicht mehr zu diesem Thread geschafft habe, +1 im Voraus für die Änderungen!
whuber
habe den gleichen Fehler in meiner Beschreibung gemacht!
Cliff AB
@whuber jetzt bin ich eigentlich der zweite, der mein eigenes Verständnis von Kovarianz errät. Ist mein Problem nur, dass ich nicht betont habe, dass die Skalen unterschiedlich sein könnten, oder fehlt mir etwas anderes? Ich bin auf Ihre "Boxen"
-Erklärung gestoßen