R-Quadrat in der Quantil-Regression

21

Ich verwende die Quantilregression, um Prädiktoren für das 90. Perzentil meiner Daten zu finden. Ich mache dies in R mit dem quantregPaket. Wie kann ich für die Quantilregression bestimmen, die angibt, wie viel Variabilität durch Prädiktorvariablen erklärt wird?r2

Was ich wirklich wissen möchte: "Jede Methode, mit der ich herausfinden kann, wie viel Variabilität erklärt wird?" Signifikanzniveaus von P - Werten sind in der Ausgabe des Befehls zur Verfügung: summary(rq(formula,tau,data)). Wie kann ich fit werden?

rnso
quelle
7
R2 ist für die Quantilregression nicht relevant.
whuber
@whuber: Gibt es eine alternative Methode, mit der ich herausfinden kann, wie viel Variabilität erklärt wird?
RNSO
2
Das ist eine gute Sache, die Sie im Hauptteil Ihrer Frage stellen sollten, anstatt sie in einem Kommentar zu vergraben! "Variabilität erklärt" (jedenfalls gemessen an Varianzen) ist im Wesentlichen ein Konzept der kleinsten Quadrate; Vielleicht ist das, was Sie wollen, ein geeignetes Maß für die statistische Signifikanz oder möglicherweise die Anpassungsgüte.
whuber
Für jede Leistungszahl müssen Sie berücksichtigen, was eine gute Leistung, was eine schlechte Leistung und was irrelevant wäre. Zum Beispiel ist es keine Kritik am 90. Perzentil, wenn das ein mieser Prädiktor für das 10. Perzentil ist. Ihr Maßstab könnte das sein, was Sie auch verwenden, wenn Sie keine Quantilregression verwenden. Wenn Ihre Prädiktoren stetig sind, ist dies möglicherweise schwer zu definieren.
Nick Cox
1
@whuber: Ich habe das im Hauptteil der Frage hinzugefügt. Das Signifikanzniveau nach P-Wert ist in der Zusammenfassung (rq (Formel, Tau, Daten)) verfügbar. Wie kann ich fit werden?
RNSO

Antworten:

23

Koenker und Machado [ 1 ] beschreiben R 1 , ein lokales Maß für die Anpassungsgüte am jeweiligen ( τ ) -Quantil.[1]R1τ

V(τ)=minbρτ(yixib)

Let und für das gesamte Modell der Koeffizient Schätzungen sein, und einem eingeschränkten Modell und lassen und sein die entsprechenden Terme.β^(τ)β~(τ)V^V~V

Sie definieren das Anpassungsgütekriterium .R1(τ)=1V^V~

Koenker gibt Code für hier ,V

rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))

Wenn wir also für ein Modell mit einem Intercept-Only ( - oder im folgenden Codeausschnitt) und dann einem uneingeschränkten Modell ( ) berechnen, können wir - zumindest theoretisch - etwas wie das übliche .VV~V0V^R1 <- 1-Vhat/V0R2

Bearbeiten: In Ihrem Fall ist natürlich das zweite Argument, das f$tauin dem Aufruf in der zweiten Codezeile eingefügt wird, der von tauIhnen verwendete Wert . Der Wert in der ersten Zeile legt lediglich den Standard fest.

Das Erklären der Varianz über den Mittelwert ist nicht das, was Sie mit der quantilen Regression tun. Sie sollten also nicht damit rechnen, ein wirklich gleichwertiges Maß zu haben.

Ich denke nicht, dass sich das Konzept von gut auf die Quantilregression übertragen lässt. Sie können wie hier verschiedene mehr oder weniger analoge Größen definieren, aber unabhängig davon, was Sie auswählen, werden Sie nicht die meisten Eigenschaften haben, die reales in der OLS-Regression hat. Sie müssen sich darüber im Klaren sein, welche Eigenschaften Sie benötigen und welche nicht - in einigen Fällen kann es möglich sein, dass eine Kennzahl das tut, was Sie wollen.R2R2

-

[1] Koenker, R und Machado, J (1999), Anpassungsgüte
und verwandte Inferenzprozesse für die quantitative Regression,
Journal of the American Statistical Association, 94 : 448, 1296-1310

Glen_b - Setzen Sie Monica wieder ein
quelle
Sollte tau = 0,9 statt 0,5 sein?
Dimitriy V. Masterov
Ja, das sollte es, aber wenn Sie das richtige zweite Argument angeben (wie in der zweiten Zeile, die ich oben zitiert habe, angegeben), funktioniert es so. Der Wert 0,5 in der ersten Zeile ist einfach ein Standardargument, wenn Sie taubeim Aufruf der Funktion nichts angeben . Ich werde in der Post klären.
Glen_b
@ Glen_b Danke für die Erklärung. Wenn ich nichts Dummes tue, scheint V eher die Summe der gewichteten Abweichungen vom geschätzten Quantil zu sein als ein Pseudo- . R2
Dimitriy V. Masterov
@ Dimitriy Äh, du hast recht, ich habe etwas ausgelassen. Ich werde dies in Kürze beheben.
Glen_b
@Dimitriy Ich denke, ich habe es jetzt behoben.
Glen_b
19

Das von Koenker und Machado (1999) in JASA vorgeschlagene Pseudo- Maß misst die Anpassungsgüte, indem es die Summe der gewichteten Abweichungen für das interessierende Modell mit der gleichen Summe aus einem Modell vergleicht, in dem nur der Achsenabschnitt auftritt. Es wird berechnet alsR2

R1(τ)=1yiy^iτ|yiy^i|+yi<y^i(1τ)|yiy^i|yiy¯τ|yiy¯|+yi<y¯i(1τ)|yiy¯|,

Dabei ist das angepasste te Quantil für die Beobachtung , und ist der angepasste Wert aus dem reinen Achsenabschnitt Modell.y^i=ατ+βτxτiy¯=βτ

R1(τ) sollte in , wobei 1 einer perfekten Anpassung entsprechen würde, da der Zähler, der aus der gewichteten Summe der Abweichungen besteht, Null wäre. Es ist ein lokales Maß für die Eignung für QRM, da es im Gegensatz zum globalen von OLS von abhängt . Das ist wohl die Quelle der Warnungen über die Verwendung: Wenn Ihr Modell in das Heck passt, gibt es keine Garantie dafür, dass es an einer anderen Stelle gut passt. Dieser Ansatz könnte auch zum Vergleichen verschachtelter Modelle verwendet werden.[0,1]τR2

Hier ist ein Beispiel in R:

library(quantreg)
data(engel)

fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)

rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho

Dies könnte wahrscheinlich eleganter durchgeführt werden.

Dimitriy V. Masterov
quelle
Ihre Formel wird nicht gut angezeigt. Nach dem Minuszeichen: R_1(\tau) = 1 - 􀀀Das letzte Zeichen ist ein Durcheinander. Könnten Sie das überprüfen? Vielleicht haben Sie ein nicht standardmäßiges Zeichen eingefügt, anstatt Tex zu verwenden.
Tim
@Tim Ich sehe nichts Seltsames, weder im Text noch auf dem Bildschirm.
Dimitriy V. Masterov
Es sieht sowohl unter Linux als auch unter Windows so aus: snag.gy/ZAp5T.jpg
Tim
@Tim Dieses Kästchen entspricht nichts und kann ignoriert werden. Ich werde versuchen, es später von einem anderen Computer aus zu bearbeiten.
Dimitriy V. Masterov