Ich habe einige Beispiele von Daten der Form und . Ich möchte eine Ebene an die Daten mit den kleinsten mittleren quadratischen Fehlern anpassen.
Ich habe in Abschnitt 3 dieses Dokuments eine "Antwort" gefunden , die jedoch in Form einiger zu lösender Gleichungen verbleibt. Ich habe gerade die Fähigkeit, diese Gleichungen zu lösen, aber der Prozess wird so chaotisch, dass die Wahrscheinlichkeit, dass ich einen Fehler mache, ziemlich hoch ist. Sicherlich hat irgendwo jemand die vollständige Lösung in Langform geschrieben (sie könnte als "geschlossene Form" bezeichnet werden), und zwar in der Form
EDIT: Vielleicht ist "geschlossene Form" der falsche Ausdruck. Also lass mich klar sein. Ich möchte eine explizite Lösung für , und und keine Lösung, die mit "Wenn Sie diese Gleichungen lösen können, können Sie die Werte von , und " endet .
Antworten:
An anderer Stelle auf dieser Website finden Sie explizite Lösungen für die gewöhnliche Regression der kleinsten Quadrate
sind in Matrixform als erhältlich
woX. ist die "Modellmatrix"
undz ist der Antwortvektor
Das ist eine vollkommen feine, explizite und berechenbare Antwort. Aber vielleicht gibt es ein zusätzliches Verständnis, das durch Inspektion der Koeffizienten herausgerissen werden kann. Dies kann erreicht werden, indem geeignete Einheiten ausgewählt werden, in denen die Variablen ausgedrückt werden sollen.
Die besten Einheiten für diesen Zweck zentrieren jede Variable auf ihren Mittelwert und verwenden ihre Standardabweichung als Maßeinheit. Lassen Sie die drei Mittel explizit seinmx,my, und mz und die drei Standardabweichungen sind sx,sy, und sz . (Es stellt sich heraus, dass es keine Rolle spielt, ob Sie durch teilenn oder n - 1 bei der Berechnung der Standardabweichungen. Stellen Sie einfach sicher, dass Sie eine konsistente Konvention verwenden, wenn Sie einen zweiten Moment der Daten berechnen.) Die Werte der Variablen in diesen neuen Maßeinheiten sind
Dieser Prozess wird als Standardisierung der Daten bezeichnet. Die Variablenξ , η , und ζ sind die standardisierten Versionen der ursprünglichen Variablenx , y , und z .
Diese Beziehungen sind invertierbar:
Einfügen dieser in die definierende Beziehung
und Vereinfachung der Erträge
Lösung für die Erwartung der abhängigen Variablenζich ergibt
Wenn wir diese Koeffizienten schreiben alsβ0,β1,β2 jeweils können wir uns dann erholen A,B,C durch Vergleichen und Lösen. Für die Aufzeichnung gibt dies
Der Punkt davon wird deutlich, wenn wir die neue Modellmatrix betrachten
und die neue Antwortmatrixζ=(ζ1,ζ2,…,ζn) , weil jetzt
und
woρ ist der Korrelationskoeffizient 1n∑ni = 1ξichηich , τ ist der Korrelationskoeffizient 1n∑ni = 1ξichζich , und υ ist der Korrelationskoeffizient 1n∑ni = 1ηichζich .
Um die normalen Gleichungen zu lösen( 1 ) wir können beide Seiten durch teilen n geben
Was ursprünglich wie eine beeindruckende Matrixformel aussah, wurde auf einen wirklich elementaren Satz von drei simultanen Gleichungen reduziert. Unter der Voraussetzung| ρ | <1 ist seine Lösung leicht zu finden
Stecken Sie diese in die Koeffizienten in( 2 ) erzeugt die Schätzungen EIN^,B.^, und C.^ .
In der Tat wurde noch mehr erreicht:
Es ist jetzt offensichtlich, warum die Fälle| ρ | =1 sind problematisch: Sie führen eine Division durch Null in die Lösung ein.
Es ist ebenso offensichtlich, wie zu bestimmen ist, ob wann eine Lösung existiert| ρ=1 | und wie man es erhält. Es wird existieren, wenn die zweite und dritte Normalgleichung inΞ sind redundant und werden einfach durch Ignorieren einer der Variablen erhalten x und y an erster Stelle.
Wir können allgemein einen Einblick in die Lösung gewinnen. Zum Beispiel vonβ^0= 0 In allen Fällen können wir den Schluss ziehen, dass die angepasste Ebene den Mittelwertpunkt durchlaufen muss(mx,my,mz) .
Es ist nun offensichtlich, dass die Lösung in Bezug auf die ersten beiden Momente des trivariaten Datensatzes gefunden werden kann( x , y, z) . Dies wirft ein weiteres Licht auf die Tatsache, dass Koeffizientenschätzungen allein aus Mittelwerten und Kovarianzmatrizen ermittelt werden können .
Weiterhin Gleichung( 2 ) zeigt, dass die Mittel nur zur Schätzung des Intercept-Terms benötigt werden C. . Schätzungen der beiden PistenEIN und B. benötigen nur die zweiten Momente.
Wenn die Regressoren nicht korreliert sind,ρ = 0 und die Lösung besteht darin, dass der Achsenabschnitt Null ist und die Steigungen die Korrelationskoeffizienten zwischen der Antwort sind z und die Regressoren x und y wenn wir die Daten standardisieren. Dies ist sowohl leicht zu merken als auch bietet einen Einblick in die Beziehung zwischen Regressionskoeffizienten und Korrelationskoeffizienten.
Wenn wir das alles zusammenfassen, finden wir das (außer in den entarteten Fällen)| ρ | =1 ) Die Schätzungen können geschrieben werden
In diesen Formeln ist diem∗ sind die Beispielmittel, die s∗ sind die Standardabweichungen der Stichprobe und die griechischen Buchstaben ρ , τ, und υ repräsentieren die drei Korrelationskoeffizienten (zwischen x und y , x und z , und y und z , beziehungsweise).
Bitte beachten Sie, dass diese Formeln nicht der beste Weg sind, um die Berechnungen durchzuführen. Sie alle beinhalten das Subtrahieren von Mengen, die von vergleichbarer Größe sein könnten, wie zτ- ρ υ , υ - ρτ , und mz- (( -mxEIN^- -myB.^) . Eine solche Subtraktion beinhaltet einen Genauigkeitsverlust. Die Matrixformulierung ermöglicht es numerischen Analysten, stabilere Lösungen zu erhalten, die so viel Präzision wie möglich bewahren. Aus diesem Grund haben Menschen selten Interesse an termingerechten Formeln. Der andere Grund, warum wenig Interesse besteht, ist, dass mit zunehmender Anzahl von Regressoren die Komplexität der Formeln exponentiell zunimmt und schnell zu unhandlich wird.
Als weiteren Beweis für die Richtigkeit dieser Formeln können wir ihre Antworten mit denen eines Standardlösers für kleinste Quadrate vergleichen, der
lm
Funktion inR
.Die Ausgabe weist erwartungsgemäß zwei identische Schätzreihen auf:
quelle
Fand es...
quelle
Aber du hättest es verstehen sollen! Schauen Sie sich Ihre Entwurfsmatrix noch einmal an (erste Gleichung Seite 4). Elemente werden als (x, y) geschrieben.
Element (3,1) = Element (1,3)
Element (2,1) = Element (1,2)
Element (3,2) = Element (2,3)
und Element (3,3) ist m.
Ihre reguläre Entwurfsmatrix wird aufgelöst in (alle Beträge ersetzt)
quelle