Sind Schätzungen der Regressionskoeffizienten nicht korreliert?

11

Betrachten Sie eine einfache Regression (Normalität nicht angenommen): wobei mit dem Mittelwert und der Standardabweichung . Sind die kleinsten quadratischen Schätzungen von und korreliert?e i 0 σ a b

Yi=a+bXi+ei,
ei0σab
Arnab
quelle
2
Was denkst du? en.wikipedia.org/wiki/Ordinary_least_squares , Abschnitt "Eigenschaften endlicher Beispiele". Diese Frage wurde auf dieser Seite viele Male beantwortet.
mpiktas

Antworten:

15

Dies ist ein wichtiger Aspekt bei der Gestaltung Experimenten, bei denen es wünschenswert sein kann , keine (oder nur sehr wenig) Korrelation zu haben , unter den Schätzungen a und b . Ein solcher Mangel an Korrelation kann durch Steuern der Werte von X i erreicht werden .a^b^Xi


Um die Auswirkungen von auf die Schätzungen zu analysieren , werden die Werte ( 1 , X i ) (die Zeilenvektoren der Länge 2 sind ) vertikal zu einer Matrix X zusammengesetzt , der Entwurfsmatrix, die so viele Zeilen enthält, wie Daten und vorhanden sind (offensichtlich) zwei Spalten. Das entsprechende Y i wird zu einem langen (Spalten-) Vektor y zusammengesetzt . In diesen Begriffen ist das Modell , wenn β = ( a , b ) ' für die zusammengesetzten Koeffizienten geschrieben wirdXi(1,Xi)2XYiyβ=(a,b)

E(Y)=Xβ

Es wird (normalerweise) angenommen, dass unabhängige Zufallsvariablen sind, deren Varianzen für einige unbekannte σ > 0 eine Konstante σ 2 sind . Die abhängigen Beobachtungen y werden als eine Realisierung der vektorwertigen Zufallsvariablen Y angesehen .Yiσ2σ>0yY

Die OLS-Lösung ist

β^=(XX)1Xy,

unter der Annahme, dass diese Matrix invers existiert. Unter Verwendung der grundlegenden Eigenschaften der Matrixmultiplikation und Kovarianz

Cov(β^)=Cov((XX)1XY)=((XX)1Xσ2X(XX)1)=σ2(XX)1.

Die Matrix hat nur zwei Zeilen und zwei Spalten, die den Modellparametern ( a , b ) entsprechen . Die Korrelation von a mit b ist proportional zu den nicht-diagonalen Elementen von ( X ' X ) - 1 , die von Cramer-Regel auf das Punktprodukt der beiden Spalten proportional sind X . Da eine der Spalten alle 1 s ist, deren Punktprodukt mit der anderen Spalte (bestehend aus dem X.(XX)1(a,b)a^b^(XX)1,X1 ) ist ihre Summe, finden wirXi

und b sind unkorreliertwenn und nur die Summe (oderäquivalenterder Mittelwert) derXigleich Null ist.a^b^Xi

Diese Orthogonalitätsbedingung wird häufig durch erneutes Zentrieren des (durch Subtrahieren ihres Mittelwerts von jedem) erreicht. Obwohl dies die geschätzte Neigung nicht ändern b , ist es die geschätzte Intercept ändert ein . Ob dies wichtig ist oder nicht, hängt von der Anwendung ab.Xib^a^


Diese Analyse gilt für die multiple Regression: Die Entwurfsmatrix enthält Spalten für p unabhängige Variablen (eine zusätzliche Spalte besteht aus 1 s) und β ist ein Vektor der Länge p + 1 , ansonsten läuft alles wie zuvor. p+1p1βp+1

In der herkömmlichen Sprache werden zwei Spalten von als orthogonal bezeichnet, wenn ihr Punktprodukt Null ist. Wenn eine Spalte von X (z. B. Spalte i ) orthogonal zu allen anderen Spalten ist, ist es eine leicht zu demonstrierende algebraische Tatsache, dass alle nicht diagonalen Einträge in Zeile i und Spalte i von ( X ' X ) - 1 Null sind (d. H. sind die Komponenten i j und j i für alle j i Null). Folglich,XXiii(XX)1ijjiji

Zwei Mehrfachregressionskoeffizientenschätzungen & bgr; i und β j unkorreliert sind , wenn entweder (oder beiden) der entsprechenden Spalten der Designmatrix orthogonal zu allen anderen Spalten.β^iβ^j

Viele experimentelle Standarddesigns bestehen aus der Auswahl von Werten der unabhängigen Variablen, um die Spalten zueinander orthogonal zu machen. Dies "trennt" die resultierenden Schätzungen, indem garantiert wird - bevor jemals Daten gesammelt werden! -, dass die Schätzungen nicht korreliert werden. (Wenn die Antworten Normalverteilungen haben, bedeutet dies, dass die Schätzungen unabhängig sind, was ihre Interpretation erheblich vereinfacht.)

whuber
quelle
Die Antwort lautet "[...] nicht diagonale Elemente, die nur die Punktprodukte der beiden Spalten von X sind." Dies gilt jedoch für , nicht für ( X ' X ) - 1 ? XX(XX)1
Heisenberg
@ Heisenberg Das ist ein guter Punkt. Das war mir unklar. Bei zwei Spalten gibt es keine Mehrdeutigkeit, aber ich muss überlegen, wie die Darstellung für den Fall von mehr Spalten verbessert werden kann.
whuber
@ Heisenberg Ich bin dankbar für Ihre wahrnehmbare Beobachtung: Sie hat es mir ermöglicht, einen wesentlichen Fehler in der Diskussion des Falles der multiplen Regression zu korrigieren.
whuber