Vergleichen von Residuen zwischen OLS- und Nicht-OLS-Regressionen

9

Angenommen, Sie möchten ein lineares Modell schätzen: ( Beobachtungen der Antwort und Prädiktoren) np+1

E.(yich)=β0+j=1pβjxichj

Eine Möglichkeit, dies zu tun, ist die OLS-Lösung, dh wählen Sie die Koeffizienten so, dass die Summe der quadratischen Fehler minimal ist:

(β0,β1,,βp)T.=argMindestβ0,β1,,βpich=1n(yich- -β0- -j=1pβjxichj)2

Alternativ können Sie eine andere Verlustfunktion verwenden, z. B. die Summe der absoluten Abweichungen, sodass:

(β0,β1,,βp)T.=argMindestβ0,β1,,βpich=1n|yich- -β0- -j=1pβjxichj|

Angenommen, Sie haben die Parameter für die beiden Modelle gefunden und möchten das Modell mit dem kleinsten Wert der Verlustfunktion auswählen. Wie können Sie die Mindestwerte vergleichen, die die Verlustfunktionen im Allgemeinen erreichen? (dh nicht nur in diesem speziellen Fall - wir könnten auch andere L.p basierte Verlustfunktionen ausprobieren ) Es scheint einen Unterschied in der Skalierung der Funktionen zu geben - einer befasst sich mit Quadraten, der andere nicht.

Comp_Warrior
quelle
1
Nun, die Markov-Annahmen lassen uns zeigen, dass die erste Gleichung BLAU oder der beste lineare unverzerrte Schätzer ist. In diesem Fall wird "Best" bestimmt, indem die kleinsten Standardfehler aller möglichen Schätzer vorliegen. Ist das nicht eine angemessene Statistik?
Gregmacfarlane
2
Beachten Sie, dass und damitarg min β 0 , β 1 , , β px2x1nx2
argMindestβ0,β1,,βpich=1n(yich- -β0- -j=1pβjxichj)2argMindestβ0,β1,,βpich=1n|yich- -β0- -j=1pβjxichj|(n)argMindestβ0,β1,,βpich=1n(yich- -β0- -j=1pβjxichj)2
Manuel
1
@gmacfarlane Ich möchte hier "am besten" in Bezug auf den Mindestwert der Verlustfunktion anstelle des Standardfehlers bei den Parameterschätzungen definieren. (nur aus Neugier)
Comp_Warrior
2
Ich denke, Sie können die Anpassungen, die von zwei verschiedenen Verlustfunktionen stammen, nicht vergleichen, da sie Antworten auf verschiedene Fragen sind. Sobald Sie entscheiden, dass eine bestimmte Verlustfunktion für Ihre Situation geeignet ist, folgt die Anpassung aus dieser Entscheidung. Sie können es nicht zurückklappen, um die Wahl der Verlustfunktion zu validieren, ohne dass dies kreisförmig wird. Wenn Sie ein anderes Kriterium haben, von dem beide Verlustfunktionen verstanden werden können, können Sie es verwenden, aber Sie müssen dies im Voraus definiert haben.
Gung - Reinstate Monica
1
Beachten Sie, dass die Frage effektiv in "Wie vergleiche ich eine mittlere Abweichung mit einer Standardabweichung" umgerechnet würde, wenn das Modell für die Erwartung korrekt wäre und die Stichprobengrößen groß genug wären, dass beide Schätzungen effektiv dem Populationswert entsprechen. Unter jeder gegebenen Verteilungsannahme könnten Sie dann ihre erwartete Größe vergleichen, aber natürlich unterscheiden sich in kleinen Stichproben die Schätzungen selbst.
Glen_b -Rate State Monica

Antworten:

4

(Meinen Kommentar in eine Antwort umwandeln.)

Ich denke, Sie können die Anpassungen, die von verschiedenen Verlustfunktionen stammen, nicht vergleichen, da sie Antworten auf verschiedene Fragen sind. Sobald Sie entscheiden, dass eine bestimmte Verlustfunktion für Ihre Situation geeignet ist, folgt die Anpassung aus dieser Entscheidung. Sie können es nicht zurückklappen, um die Wahl der Verlustfunktion zu überprüfen, ohne dass dies kreisförmig wird. Wenn Sie ein anderes Kriterium haben, von dem beide Verlustfunktionen verstanden werden können, können Sie es verwenden, aber Sie müssen dies im Voraus definiert haben.

gung - Monica wieder einsetzen
quelle