Abgesehen von einigen besonderen Umständen, in denen wir die bedingte mittlere Beziehung unbedingt verstehen müssen, in welchen Situationen sollte ein Forscher OLS anstelle von Quantile Regression wählen?
Ich möchte nicht, dass die Antwort "wenn es keinen Sinn macht, die Schwanzbeziehungen zu verstehen" lautet, da wir einfach die mediane Regression als OLS-Ersatz verwenden könnten.
least-squares
econometrics
regression-strategies
quantile-regression
semiparametric
Frank Harrell
quelle
quelle
Antworten:
Wenn Sie sich für den Mittelwert interessieren, verwenden Sie OLS, wenn Sie sich im Median befinden, verwenden Sie Quantil.
Ein großer Unterschied besteht darin, dass der Mittelwert stärker von Ausreißern und anderen extremen Daten beeinflusst wird. Manchmal ist es das, was du willst. Ein Beispiel ist, wenn Ihre abhängige Variable das soziale Kapital in einer Nachbarschaft ist. Die Anwesenheit einer einzelnen Person mit viel sozialem Kapital kann für die gesamte Nachbarschaft von großer Bedeutung sein.
quelle
Die Prämisse der Frage scheint verwirrend zu sein. Im zweiten Absatz heißt es: "Wir könnten einfach die mediane Regression als OLS-Ersatz verwenden". Man beachte , dass die bedingte Median auf X Regression ist (eine Form von) Quantilsregression.
Wenn der Fehler im zugrunde liegenden Datenerzeugungsprozess normal verteilt ist (was durch Überprüfen, ob die Residuen normal sind, beurteilt werden kann), entspricht das bedingte Mittel dem bedingten Median. Darüber hinaus kann jedes Quantil, an dem Sie interessiert sein könnten (z. B. das 95. Perzentil oder das 37. Perzentil), mit Standard-OLS-Methoden für einen bestimmten Punkt in der X-Dimension bestimmt werden. Die Hauptattraktivität der Quantilregression besteht darin, dass sie robuster als OLS ist. Der Nachteil ist, dass alle getroffenen Annahmen weniger effizient sind (das heißt, Sie benötigen eine größere Stichprobe, um die gleiche Leistung zu erzielen, und Ihre Schätzungen werden ungenauer sein).
quelle
Sowohl OLS als auch Quantile Regression (QR) sind Schätztechniken zum Schätzen des Koeffizientenvektors in einem linearen Regressionsmodell y = X β + ε (für den Fall von QR siehe Koenker (1978), S. 33, zweiter Absatz).β
Verweise:
quelle
Peter Flom hatte eine großartige und prägnante Antwort, ich möchte sie nur erweitern. Der wichtigste Teil der Frage ist, wie man "schlechter" definiert.
Um schlechter zu definieren, benötigen wir einige Metriken und die Funktion, um zu berechnen, wie gut oder schlecht die Armaturen als Verlustfunktionen bezeichnet werden.
Wir können unterschiedliche Definitionen der Verlustfunktion haben, und es gibt kein Richtig oder Falsch in jeder Definition, aber unterschiedliche Definitionen erfüllen unterschiedliche Bedürfnisse. Zwei bekannte Verlustfunktionen sind der Quadratverlust und der Absolutwertverlust.
Wenn wir den Quadratverlust als Erfolgsmaßstab verwenden, ist die Quantilregression schlechter als die von OLS. Wenn wir dagegen den absoluten Wertverlust verwenden, ist die Quantilregression besser.
Welches ist die Antwort von Peter Folm:
quelle
Wenn Sie den Mittelwert schätzen möchten, können Sie ihn nicht aus der Quantilregression ableiten.
Verwenden Sie die semiparametrische ordinale Regression, wenn Sie den Mittelwert und die Quantile mit minimalen Annahmen (aber mehr Annahmen als die Quantilregression) und mit höherer Effizienz schätzen möchten. Dies gibt Ihnen auch Überschreitungswahrscheinlichkeiten. Eine ausführliche Fallstudie in meinen RMS- Kursnotizen zeigt, dass der durchschnittliche mittlere absolute Schätzfehler über mehrere Parameter (Quantile und Mittelwert) durch ordinale Regression erreicht wird. Aber um nur den Mittelwert zu schätzen, ist OLS am besten, und um nur Quantile zu schätzen, war die Quantilregression am besten.
quelle