Quantile Regressionsschätzerformel

10

Ich habe zwei verschiedene Darstellungen des Quantilregressionsschätzers gesehen, die sind

Q(βq)=i:yixiβnqyixiβq+i:yi<xiβn(1q)yixiβq

und

Q(βq)=i=1nρq(yixiβq),ρq(u)=ui(q1(ui<0))

wobei . Kann mir jemand sagen, wie man die Gleichwertigkeit dieser beiden Ausdrücke zeigt? Folgendes habe ich bisher versucht, beginnend mit dem zweiten Ausdruck.ui=yixiβq

Q(βq)=i=1nui(q1(ui<0))(yixiβq)=i=1n(yixiβq)(q1(yixiβq<0))(yixiβq)=[i:yixiβn(q(yixiβq))+i:yi<xiβn(q(yixiβq)(yixiβq))](yixiβq)
Aber von diesem Punkt an blieb ich bei der weiteren Vorgehensweise hängen. Bitte nicht, dass dies keine Hausaufgabe oder Aufgabenfrage ist. Danke vielmals.
AlexH
quelle

Antworten:

11

Wenn Sie sich erinnern, minimiert OLS die Summe der quadratischen Residuen während die mittlere Regression die Summe der absoluten Residuen minimiert . Der Schätzer für den Median oder die kleinsten absoluten Abweichungen (LAD) ist ein Sonderfall der Quantilregression, bei dem Sie . Bei der Quantilregression minimieren wir eine Summe absoluter Fehler, die asymmetrische Gewichte für die Übervorhersage und für die Untervorhersage erhalten. Sie können von der KOP-Darstellung ausgehen und diese als die Summe des Bruchteils der Daten erweitern, die mit und bei ihrem Wert von gewichtet sind , und wie folgt daran arbeiten:iui2iuiq=.5(1q)qq(1q)ui

ρq(u)=1(ui>0)qui+1(ui0)(1q)ui=1(yixiβq>0)qyixiβq+1(yixiβq0)(1q)yixiβq
Dies verwendet nur die Tatsache, dass und dann können Sie die Indikatorfunktion als der Beobachtungen neu schreiben, die die Bedingungen der Indikatoren erfüllen . Dies gibt den ersten Ausdruck, den Sie für den Quantilregressionsschätzer notiert haben.ui=yixiβq

=i:yi>xiβqnqyixiβq+i:yixiβqn(1q)yixiβq=qi:yi>xiβqnyixiβq+(1q)i:yixiβqnyixiβq=qi:yi>xiβqn(yixiβq)(1q)i:yixiβqn(yixiβq)=qi:yi>xiβqn(yixiβq)i:yixiβqn(yixiβq)+qi:yixiβqn(yixiβq)=qi=1n(yixiβq)i=1n1(yixiβq0)(yixiβq)=i=1n(q1(ui0))ui

Die zweite Zeile nimmt die Gewichte aus den Summierungen heraus. In der dritten Zeile werden die absoluten Werte entfernt und durch die tatsächlichen Werte ersetzt. Per Definition ist immer dann negativ, wenn , daher ändert sich das Vorzeichen in dieser Zeile. Die vierte Zeile multipliziert sich . Sie erkennen dann, dass und Ersetzen der Summe des Mittelterms in der vierten Zeile durch den entsprechenden Indikator Sie kommen an der fünften Linie an. Faktorisieren und dann Ersetzen vonyixiβqyi<xiβq(1q)

qi:yi>xiβqn(yixiβq)+qi:yixiβqn(yixiβq)=i=1n(yixiβq)
yixiβqui
Dies zeigt, wie die beiden Ausdrücke äquivalent sind.
Andy
quelle