Wenn wir Parameter der linearen Regression schätzen wollen, machen wir normale Gleichungen, so viele wie das lineare Modell die Anzahl der Unbekannten enthält. Warum heißen diese Gleichungen Normalgleichungen?
regression
least-squares
terminology
linear
Rashid Munir
quelle
quelle
Antworten:
Ich werde das vielleicht allgemeinste Verständnis geben, dann einige zusätzliche Details.
Normal ist ein Begriff in der Geometrie (Wikipedia):
was wiederum von einem Begriff für ein Zimmermanns- oder Maurerquadrat zu stammen scheint [1]
und aus der Geometrie bewegt sich der Begriff in Vektorräume.
Die direkte Antwort für "normale Gleichungen" finden Sie hier: http://mathworld.wolfram.com/NormalEquation.html
(In der üblichen Regressionsnotation ist ' normal zum Bereich von ')y−Xb X
Der Rest der kleinsten Quadrate ist buchstäblich senkrecht (im rechten Winkel) zu dem von überspannten Raum .X
Der Vektor liegt in Dimensionen. Die X-Matrix umfasst von diesen (oder je nachdem, wie Ihre Notation aufgebaut ist; wenn vollen Rang hat, ist es die Anzahl der Spalten von X). Die Lösung der kleinsten Quadrate ist der nächstgelegene Punkt in dem von aufgespannten Raum zu diesem Vektor (in der Tat buchstäblich die Projektion von auf den von aufgespannten Raum ). Es ist notwendigerweise der Fall, dass durch Minimieren der Summe der Quadrate die Differenz orthogonal zu dem von überspannten Raum isty n p p+1 X Xβ^ X y y X y−Xβ^ X . (Wenn es nicht wäre, gäbe es eine noch kleinere Lösung.)
Wie Whuber in den Kommentaren vorschlägt, ist es jedoch nicht ganz so eindeutig.
Nochmals auf [1] schauen:
Die Methode der normalen Gleichungen wird jedoch häufig Legendre, 1805, zugeschrieben.
[1] Miller, J. (Hrsg.) "Früheste bekannte Verwendung einiger Wörter der Mathematik, N" in Früheste bekannte Verwendung einiger Wörter der Mathematik
quelle