Wie wird die Var / Cov-Fehlermatrix in der Praxis von statistischen Analysepaketen berechnet?
Diese Idee ist mir theoretisch klar. Aber nicht in der Praxis. Ich meine, wenn ich einen Vektor von Zufallsvariablen , verstehe ich, dass die Varianz / Kovarianz-Matrix erhält das externe Produkt der vom Mittelwert abweichenden Vektoren: .
Aber wenn ich eine Stichprobe habe, sind die Fehler meiner Beobachtungen keine Zufallsvariablen. Oder besser, aber nur, wenn ich mehrere identische Proben aus derselben Population nehme. Ansonsten sind sie gegeben. Meine Frage lautet also erneut: Wie kann ein statistisches Paket eine Var / Cov-Matrix erstellen, die von einer Liste von Beobachtungen (dh einer Stichprobe) ausgeht, die vom Forscher geliefert wurden?
variance
error
covariance-matrix
beta-regression
Riccardo
quelle
quelle
Antworten:
Die Kovarianzmatrix für ein Modell vom Typ wird normalerweise als berechnet, wobei ist Restsumme der Quadrate, und sind die Freiheitsgrade (typischerweise die Anzahl der Beobachtungen abzüglich der Anzahl der Parameter).y=Xβ+ϵ
Für robuste und / oder gruppierte Standardfehler wird das Produkt geringfügig geändert. Es kann auch andere Möglichkeiten geben, die Kovarianzmatrix zu berechnen, z. B. wie durch die Erwartung äußerer Produkte nahegelegt.XtX
quelle
Dies ist in Practical Regression und Anova using R von Julian J. Faraway, Seite 21, enthalten .
Beispiel für die Berechnung in R, basierend auf einem linearen Modell von Meilen pro Gallone, das auf mehreren in der
mtcars
Datenbank enthaltenen Fahrzeugmodellspezifikationen zurückgegangen ist :ols = lm(mpg ~ disp + drat + wt, mtcars)
. Dies sind die manuellen Berechnungen und die Ausgabe derlm()
Funktion:geschätzt wie auf Seite 8 dieses Online-Dokuments als
quelle
Mit linearer Regression passen wir ein Modell . ist die abhängige Variable, die sind die Prädiktorvariablen (erklärende Variablen). Wir verwenden die uns zur Verfügung gestellten Daten (das Trainingsset oder die Stichprobe), um die Population zu schätzen . Die werden nicht als Zufallsvariablen betrachtet. Die sind aufgrund der Fehlerkomponente zufällig.Y X β X Y.Y=β∗X+ε Y X β X Y
quelle