Sind Schätzungen der Regressionskoeffizienten nicht korreliert?

Dies ist ein wichtiger Aspekt bei der Gestaltung Experimenten, bei denen es wünschenswert sein kann , keine (oder nur sehr wenig) Korrelation zu haben , unter den Schätzungen und . Ein solcher Mangel an Korrelation kann durch Steuern der Werte von . $\hat a$ $\hat b$ $X_i$

Um die Auswirkungen von auf die Schätzungen zu analysieren , werden die Werte (die Zeilenvektoren der Länge ) vertikal zu einer Matrix , der Entwurfsmatrix, die so viele Zeilen enthält, wie Daten und vorhanden sind (offensichtlich) zwei Spalten. Das entsprechende wird zu einem langen (Spalten-) Vektor . In diesen Begriffen ist das Modell , wenn für die zusammengesetzten Koeffizienten geschrieben wird $X_i$ $(1,X_i)$ $2$ $X$ $Y_i$ $y$ $\beta = (a,b)^\prime$

E (Y) = X \cdot β

$\mathbb{E}(Y) = X \cdot \beta$

Es wird (normalerweise) angenommen, dass unabhängige Zufallsvariablen sind, deren Varianzen für einige unbekannte eine Konstante . Die abhängigen Beobachtungen werden als eine Realisierung der vektorwertigen Zufallsvariablen . $Y_i$ $\sigma^2$ $\sigma \gt 0$ $y$ $Y$

Die OLS-Lösung ist

\hat{β} = {(X^{'} X)}^{- 1} X^{'} y,

$\hat\beta = \left(X^\prime X\right)^{-1} X^\prime y,$

unter der Annahme, dass diese Matrix invers existiert. Unter Verwendung der grundlegenden Eigenschaften der Matrixmultiplikation und Kovarianz

Cov (\hat{β}) = Cov ({(X^{'} X)}^{- 1} X^{'} Y) = ({(X^{'} X)}^{- 1} X^{'} σ^{2} X {(X^{'} X)}^{- 1'}) = σ^{2} {(X^{'} X)}^{- 1} .

$\text{Cov}(\hat\beta) = \text{Cov}\left(\left(X^\prime X\right)^{-1} X^\prime Y\right) = \left(\left(X^\prime X\right)^{-1} X^\prime\sigma^2 X \left( X^\prime X \right)^{-1\prime} \right) = \sigma^2 \left(X^\prime X\right)^{-1}.$

Die Matrix hat nur zwei Zeilen und zwei Spalten, die den Modellparametern . Die Korrelation von mit ist proportional zu den nicht-diagonalen Elementen von die von Cramer-Regel auf das Punktprodukt der beiden Spalten proportional sind . Da eine der Spalten alle s ist, deren Punktprodukt mit der anderen Spalte (bestehend aus dem $\left(X^\prime X\right)^{-1}$ $(a,b)$ $\hat a$ $\hat b$ $(X^\prime X)^{-1},$ $X$ $1$ ) ist ihre Summe, finden wir $X_i$

und sind unkorreliertwenn und nur die Summe (oderäquivalenterder Mittelwert) dergleich Null ist. $\hat a$ $\hat b$ $X_i$

Diese Orthogonalitätsbedingung wird häufig durch erneutes Zentrieren des (durch Subtrahieren ihres Mittelwerts von jedem) erreicht. Obwohl dies die geschätzte Neigung nicht ändern , ist es die geschätzte Intercept ändert . Ob dies wichtig ist oder nicht, hängt von der Anwendung ab. $X_i$ $\hat b$ $\hat a$

Diese Analyse gilt für die multiple Regression: Die Entwurfsmatrix enthält Spalten für unabhängige Variablen (eine zusätzliche Spalte besteht aus s) und ist ein Vektor der Länge , ansonsten läuft alles wie zuvor. $p+1$ $p$ $1$ $\beta$ $p+1$

In der herkömmlichen Sprache werden zwei Spalten von als orthogonal bezeichnet, wenn ihr Punktprodukt Null ist. Wenn eine Spalte von (z. B. Spalte ) orthogonal zu allen anderen Spalten ist, ist es eine leicht zu demonstrierende algebraische Tatsache, dass alle nicht diagonalen Einträge in Zeile und Spalte von Null sind (d. H. sind die Komponenten und für alle Null). Folglich, $X$ $X$ $i$ $i$ $i$ $(X^\prime X)^{-1}$ $ij$ $ji$ $j\ne i$

Zwei Mehrfachregressionskoeffizientenschätzungen und unkorreliert sind , wenn entweder (oder beiden) der entsprechenden Spalten der Designmatrix orthogonal zu allen anderen Spalten. $\hat\beta_i$ $\hat\beta_j$

Viele experimentelle Standarddesigns bestehen aus der Auswahl von Werten der unabhängigen Variablen, um die Spalten zueinander orthogonal zu machen. Dies "trennt" die resultierenden Schätzungen, indem garantiert wird - bevor jemals Daten gesammelt werden! -, dass die Schätzungen nicht korreliert werden. (Wenn die Antworten Normalverteilungen haben, bedeutet dies, dass die Schätzungen unabhängig sind, was ihre Interpretation erheblich vereinfacht.)

whuber
quelle

Die Antwort lautet "[...] nicht diagonale Elemente, die nur die Punktprodukte der beiden Spalten von X sind." Dies gilt jedoch für

, nicht für

X^{'} X

$X'X$

(X^{'} X)^{- 1}

$(X'X)^{-1}$

Heisenberg

@ Heisenberg Das ist ein guter Punkt. Das war mir unklar. Bei zwei Spalten gibt es keine Mehrdeutigkeit, aber ich muss überlegen, wie die Darstellung für den Fall von mehr Spalten verbessert werden kann.

whuber

@ Heisenberg Ich bin dankbar für Ihre wahrnehmbare Beobachtung: Sie hat es mir ermöglicht, einen wesentlichen Fehler in der Diskussion des Falles der multiplen Regression zu korrigieren.

whuber

Sind Schätzungen der Regressionskoeffizienten nicht korreliert?

Antworten: