Ich hoffe auf eine intuitive, verständliche Erklärung der Quantilregression.
Angenommen, ich habe einen einfachen Datensatz mit dem Ergebnis und den Prädiktoren .X 1 , X 2
Wenn ich zum Beispiel eine Quantil-Regression bei .25, .5, .75 durchführe und .
Werden die -Werte durch einfaches Ordnen der Werte und Ausführen einer linearen Regression basierend auf den Beispielen gefunden, die sich bei / nahe dem gegebenen Quantil befinden?y
Oder tragen alle Stichproben zu den Schätzungen bei, wobei die Gewichtung mit zunehmender Entfernung vom Quantil abnimmt?
Oder ist es etwas ganz anderes? Ich habe noch keine zugängliche Erklärung gefunden.
quantile-regression
Jeremy
quelle
quelle
Antworten:
Ich empfehle Koenker & Hallock (2001, Journal of Economic Perspectives) und Koenkers gleichnamiges Lehrbuch .
Ihre Intuition ist also ganz richtig: Alle Stichproben tragen zu den Schätzungen bei, wobei asymmetrische Gewichte von dem Quantil τ abhängen, das wir anstreben.β τ
quelle
foo <- sample(x=c(1,2,4,10),size=1e6,prob=c(.4,.2,.2,.2),replace=TRUE); xx <- seq(1,10,by=.1); plot(xx,sapply(xx,FUN=function(yy)mean(abs(yy-foo))),type="l")
Die Grundidee der quantilen Regression beruht auf der Tatsache, dass der Analyst an der Verteilung von Daten interessiert ist und nicht nur an der Mittelung von Daten. Fangen wir mit dem Mittelwert an.
Auf der anderen Seite sucht die mediane Regression nach einer Linie, bei der die Hälfte der Daten auf Seiten liegt. In diesem Fall lautet die Zielfunktionwoist die erste Norm.| . |argMindestβ| y- Xβ| | . |
Ausweitung des Medianwerts auf Quantilergebnisse in der Quantilregression. Die Idee dahinter ist , eine Linie zu finden , dass -percent von Daten über das ist.α
Hier haben Sie einen kleinen Fehler gemacht. Q-Regression ist nicht so, als würde man ein Quantil von Daten finden und dann eine Linie zu dieser Teilmenge (oder sogar zu den herausfordernderen Grenzen) passen.
Die Q-Regression sucht nach einer Linie, die Daten in eine Q-Gruppe a Quantil und die Reste aufteilt . Die Zielfunktion für die Q-Regression lautetα
Wie Sie sehen, ist diese clevere Zielfunktion nichts anderes, als Quantil in ein Optimierungsproblem zu übersetzen.
Wie Sie sehen, wird die Q-Regression außerdem für eine bestimmte Menge definiert ( ) und kann dann erweitert werden, um alle Mengen zu finden. Mit anderen Worten kann die Q-Regression die (bedingte) Verteilung der Antwort reproduzieren.βα
quelle