Ich habe eine Frage zum Steigungskoeffizienten von OLS im Vergleich zu dem für die Quantilregression, wenn homoskedastische Fehlerterme auftreten. Das Bevölkerungsmodell könnte folgendermaßen aussehen:
wobei iid Fehlerbegriffe sind. Konvergiert der geschätzte Steigungskoeffizient für OLS und für QR für verschiedene Quantile gegen denselben Wert ? Während die Stichprobenschätzungen durchaus voneinander abweichen können.
In Anbetracht der Konvergenz der QR-Schätzer weiß ich, dass bei Vorhandensein von Homoskedastizität alle Steigungsparameter für verschiedene Quantilregressionen auf denselben Wert konvergieren (wie von Koenker 2005: 12 gezeigt). Ich bin mir jedoch nicht sicher, wie sich die Konvergenz des OLS-Koeffizienten mit der des mittleren QR-Koeffizienten (LAD) . Gibt es einen Beweis dafür, dass beide zum gleichen Wert konvergieren? Meine Intuition sagt mir, dass dies der Fall sein sollte.
Die Antwort liegt wahrscheinlich in den Verlustfunktionen für OLS und QR. OLS minimiert quadratische Residuen, während QR (für den Median) absolute Abweichungen minimiert. Da Fehler quadriert werden, legt OLS im Gegensatz zu QR mehr Gewicht auf Ausreißer. Aber sollten sich Ausreißer bei Homoskedastizität nicht gegenseitig aufheben, weil positive Fehler genauso wahrscheinlich sind wie negative, wodurch OLS und der mittlere QR-Steigungskoeffizient äquivalent werden (zumindest in Bezug auf die Konvergenz)?
Update
Um die Vorhersage zu testen, dass für die Homoskedastizität die Steigungskoeffizienten für verschiedene Quantile äquivalent sind, habe ich einen Test in stata durchgeführt. Dies geschieht nur, um das zuvor erwähnte Ergebnis von Koenker (2005) zu bestätigen. Die ursprüngliche Frage betrifft die Konvergenz von OLS im Vergleich zu QR. Ich habe n = 2000 Beobachtungen mit Stata erstellt über:
set obs 2000
set seed 98034
generate u = rnormal(0,8)
generate x = runiform(0,50)
generate y = 1 + x + u
Für diese Stichprobe führte ich eine QR-Regression für die Quantile (0,10, 0,50, 0,90) durch und testete dann die gemeinsame Hypothese, dass der Steigungskoeffizient für die drei Quantile identisch ist, dh:
Dies ist der entsprechende Statistikcode:
sqreg y x, quantile(.1, .5, .9) reps(400)
test [q10=q50=q90]: x
Die Beweise waren überwältigend, der H0 konnte sehr stark nicht abgelehnt werden. Ausgabe für den Wald-Test:
F( 2, 1998) = 0.79
Prob > F = 0.4524
Dies bestätigte meine Gedanken, gibt aber keine theoretische Anleitung, ob dies immer zu erwarten ist.
quelle
Antworten:
Nein, natürlich nicht, da die zu minimierende empirische Verlustfunktion in diesen verschiedenen Fällen unterschiedlich ist (OLS vs. QR für verschiedene Quantile).
Nein, nicht in endlichen Stichproben. Hier ist ein Beispiel aus den Hilfedateien des "quantreg" -Pakets in R:
Asymptotisch konvergieren sie jedoch alle zum gleichen wahren Wert.
Erstens ist eine perfekte Fehlersymmetrie in keiner endlichen Stichprobe garantiert. Zweitens führt das Minimieren der Summe von Quadraten gegenüber absoluten Werten im Allgemeinen zu unterschiedlichen Werten, selbst bei symmetrischen Fehlern.
quelle
Im Allgemeinen lautet die Antwort ja, zumindest für Theils Regression, die ein Sonderfall der QR ist. Der Steigungsschätzer für Theils Regression ist ein unvoreingenommener Schätzer der Populationssteigung. Wenn alle Anforderungen für OLS erfüllt sind, liegt die relative Effizienz bei 85%. Unter bestimmten Umständen wird es relativ gesehen effizienter als die kleinsten Quadrate.
Wenn Sie nicht mit einer unendlichen Datenmenge herum sitzen, sondern stattdessen eine kleine Stichprobe haben, gibt es viele Stellen, an denen dies vorzuziehen wäre. Schräglauf und Abschneiden, indem negative Werte nicht zugelassen werden, können einen starken Einfluss auf OLS und wenig bis gar keinen Einfluss auf Theils Methode haben.
quelle