Ich habe zwei Regressionen des gleichen Y und des dreistufigen X. Insgesamt n = 15, mit n = 5 in jeder Gruppe oder Stufe von X. Die erste Regression behandelt das X als kategorisch und weist den Stufen 2 und 3 mit Stufe Indikatorvariablen zu eine davon ist die Referenz. Indikatoren / Dummies sind wie folgt: X1 = 1, wenn Level = 2, 0, wenn sonst X2 = 1, wenn Level = 3, 0, wenn sonst
Infolgedessen sieht mein angepasstes Modell ungefähr so aus: y = b0 + b1 (x1) + b2 (x2)
Ich führe die Regression aus und die Ausgabe enthält diese Varianzanalyse-Tabelle:
Der Rest der Ausgabe ist hier irrelevant.
Okay, jetzt führe ich eine andere Regression für dieselben Daten durch. Ich lasse die kategoriale Analyse fallen und behandle X als stetig, aber ich füge der Gleichung eine Variable hinzu: X ^ 2, das Quadrat von X. Jetzt habe ich das folgende Modell: y = b0 + b1 (X) + b2 (X) ^ 2
Wenn ich es ausführe, spuckt es genau die Varianzanalyse-Tabelle aus, die ich Ihnen oben gezeigt habe. Warum führen diese beiden Regressionen zu denselben Tabellen?
[Der Verdienst für dieses kleine Rätsel geht an Thomas Belin in der Abteilung für Biostatistik der University of California in Los Angeles.]
quelle
Antworten:
In Matrixbegriffen haben Ihre Modelle die übliche Form .E[Y]=Xβ
Das erste Modell repräsentiert ein Element der ersten Gruppe durch die Zeile in X , entsprechend dem Achsenabschnitt, dem Indikator für Kategorie 2 und dem Indikator für Kategorie 3. Es repräsentiert ein Element der zweiten Gruppe durch die Zeile ( 1 , 1 , 0 )(1,0,0) X (1,1,0) und ein Element der dritten Gruppe durch .(1,0,1)
Das zweite Modell verwendet stattdessen die Zeilen , ( 1 , 2 , 2 2 ) = ( 1 , 2 , 4 ) und ( 1 , 3 , 3 2 ) = ( 1 , 3 , 9 ) .(1,1,12)=(1,1,1) (1,2,22)=(1,2,4) (1,3,32)=(1,3,9)
Nennen wir die resultierenden Modellmatrizen und X 2 . Sie sind einfach miteinander verbunden: Die Spalten der einen sind lineare Kombinationen der Spalten der anderen. Zum Beispiel lassenX1 X2
Dann seit
es folgt dem
Die Modelle selbst sind daher verwandt mit
Das heißt, die Koeffizienten für das zweite Modell müssen mit denen des ersten Modells über in Beziehung gesetzt werdenβ2
Die gleiche Beziehung gilt daher für ihre Schätzungen der kleinsten Quadrate. Dies zeigt, dass die Modelle identische Passformen haben : Sie drücken sie lediglich unterschiedlich aus.
Da die ersten Spalten der beiden Modellmatrizen identisch sind, ändert sich keine ANOVA-Tabelle, die die Varianz zwischen der ersten Spalte und den verbleibenden Spalten zerlegt. Eine ANOVA-Tabelle, die zwischen der zweiten und dritten Spalte unterscheidet, hängt jedoch davon ab, wie die Daten codiert werden.
Geometrisch (und etwas abstrakter) stimmt der dreidimensionale Unterraum von , der durch die Spalten von X 1 erzeugt wird, mit dem Unterraum überein, der durch die Spalten von X 2 erzeugt wird . Daher haben die Modelle identische Passformen. Die Anpassungen werden nur deshalb unterschiedlich ausgedrückt, weil die Räume mit zwei verschiedenen Basen beschrieben werden.R15 X1 X2
Zur Veranschaulichung finden Sie hier Daten wie Ihre (jedoch mit unterschiedlichen Antworten) und die entsprechenden Analysen, wie sie in generiert wurden
R
.Passen Sie die beiden Modelle an:
Zeigen Sie ihre ANOVA-Tabellen an:
Die Ausgabe für das erste Modell ist
Für das zweite Modell ist es
Sie können sehen, dass die verbleibenden Quadratsummen gleich sind. Durch Hinzufügen der ersten beiden Zeilen im zweiten Modell erhalten Sie den gleichen DF und die gleiche Quadratsumme, aus der der gleiche Mittelwert, der gleiche F-Wert und der gleiche p-Wert berechnet werden können.
Vergleichen wir abschließend die Koeffizientenschätzungen.
Die Ausgabe ist
Die Passungen sind wirklich die gleichen wie behauptet.
quelle
Kurz gesagt, beide Modelle sind in dem Sinne gesättigt, dass sie eindeutige empirische Vorhersagen der Reaktion auf allen drei Ebenen von X liefern. Es kann für die Codierung der Faktorvariablen in Modell 1 offensichtlich sein. Für einen quadratischen Trend ist es interessant festzustellen, dass a Die quadratische Formel kann 3 beliebige Punkte interpolieren. Während die Kontraste unterschiedlich sind, liefert in beiden Modellen der globale Test gegen eine Null eines Intercept-Only-Modells identische Schlussfolgerungen.
quelle