Diese Frage ist inspiriert von der langen Diskussion in den Kommentaren hier: Wie verwendet die lineare Regression die Normalverteilung?
In dem üblichen linearen Regressionsmodell wird hier der Einfachheit halber mit nur einem Prädiktor geschrieben: wobei bekannte Konstanten sind und unabhängige Fehlerterme mit dem Mittelwert Null sind. Wenn wir zusätzlich Normalverteilungen für die Fehler übernehmen, dann die üblichen kleinsten Quadrate Schätzer und die Maximum - Likelihood - Schätzer von sind identisch.x i ϵ i β 0 , β 1
Also meine einfache Frage: Gibt es eine andere Verteilung für die Fehlerausdrücke, so dass die mle mit dem gewöhnlichen Kleinstquadratschätzer identisch sind? Die eine Implikation ist leicht zu zeigen, die andere nicht.
regression
normal-distribution
mathematical-statistics
maximum-likelihood
least-squares
kjetil b halvorsen
quelle
quelle
Antworten:
Bei der Maximum-Likelihood-Schätzung berechnen wir
Die letzte Beziehung berücksichtigt die Linearitätsstruktur der Regressionsgleichung.
Im Vergleich dazu ist der OLS-Schätzer zufriedenstellend
Um identische algebraische Ausdrücke für die Steigungskoeffizienten zu erhalten, müssen wir eine Dichte für den Fehlerterm haben, so dass
Dies sind Differentialgleichungen der Form , die Lösungen habeny′=±xy
Jede Funktion, die diesen Kernel hat und über eine geeignete Domäne zu einer Einheit integriert wird, macht MLE und OLS für die Steigungskoeffizienten identisch. Wir suchen nämlich
Gibt es ein solches , das nicht die normale Dichte (oder die Halbnormale oder die Ableitung der Fehlerfunktion) ist?g
Bestimmt. Aber man muss noch Folgendes berücksichtigen: Wenn man das Pluszeichen im Exponenten und eine symmetrische Unterstützung um beispielsweise Null verwendet, erhält man eine Dichte mit einem eindeutigen Minimum in der Mitte und zwei lokalen Maxima bei die Grenzen der Unterstützung.
quelle
Wenn wir definieren die OLS als Lösung beliebige Dichte f ( y | x , β 0 , β 1 ) , so dass arg β 0 , β 1 min n ∑ i = 1 log { f (
quelle
Ich wusste nichts über diese Frage, bis @ Xi'an eine Antwort erhielt. Es gibt eine allgemeinere Lösung. Exponentielle Familienverteilungen mit einigen Parametern ergaben einen festen Ertrag für Bregman-Divergenzen. Für solche Verteilungen ist Mittelwert der Minimierer. OLS-Minimierer ist auch der Mittelwert. Daher sollten sie für alle derartigen Verteilungen übereinstimmen, wenn die lineare Funktion mit dem mittleren Parameter verknüpft ist.
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf
quelle