Welche Bedeutung hat die Hutmatrix für die Regressionsanalyse?
Ist es nur zur einfacheren Berechnung?
regression
multiple-regression
least-squares
Benutzer 31466
quelle
quelle
Antworten:
Bei der Untersuchung der linearen Regression ist der grundlegende Ausgangspunkt der wobei und deterministisch. Nach dem Minimieren des Kriteriums der kleinsten Quadrate findet man einen Schätzer für , dh . Nach dem Einstecken des Schätzers in die Anfangsformel erhält man als lineares Modell des Datenerzeugungsprozesses. Jetzt kann man den Schätzer für ersetzen.y= XB + u u∼N(0,σ2I) X Bˆ B Bˆ=(X′X)−1X′y yˆ=XBˆ Bˆ und erhältyˆ=X(X′X)−1X′y.
So ist tatsächlich eine Projektionsmatrix. Stellen Sie sich vor, Sie nehmen alle Variablen in . Die Variablen sind Vektoren und erstrecken sich über einen Raum. Wenn Sie also mit multiplizieren , projizieren Sie Ihre beobachteten Werte in auf den Raum, der von den Variablen in überspannt wird . Es gibt die Schätzungen für und das ist der Grund, warum es als Hutmatrix bezeichnet wird und warum es eine solche Bedeutung hat. Schließlich ist die lineare Regression nichts anderes als eine Projektion, und mit der Projektionsmatrix können wir nicht nur die Schätzungen für berechnen.H=X(X′X)−1X′ X H y y X y y aber auch für und kann zum Beispiel prüfen, ob es wirklich normal verteilt ist.u
Ich habe dieses schöne Bild im Internet gefunden und es visualisiert diese Projektion. Bitte beachten Sie, dass anstelle von . Darüber hinaus betont das Bild, dass der Vektor der Fehlerterme orthogonal zur Projektion ist und daher nicht mit den Schätzungen für korreliert.β B y
quelle
Die Hutmatrix ist aus mehreren Gründen sehr nützlich:
quelle
Es ist nichts weiter als die "nächste" Lösung für Ax = b zu finden, wobei b nicht im Spaltenraum von A liegt. Wir projizieren b auf den Spaltenraum und lösen nach Ax (hat) = p, wobei p die Projektion von b auf ist Spaltenraum.
quelle