Perzentilverlustfunktionen

11

Die Lösung des Problems:

minmE[|mX|]

ist bekanntlich der Median von , aber wie sieht die Verlustfunktion für andere Perzentile aus? Beispiel: Das 25. Perzentil von X ist die Lösung für:X

minmE[L(m,X)]

Was ist in diesem Fall?L

Cam.Davidson.Pilon
quelle

Antworten:

12

Lassen Sie die Indikatorfunktion sein: Sie ist gleich für wahre Argumente und ansonsten. Wählen Sie und setzen SieI100<α<1

Λα(x)=αxI(x0)(1α)xI(x<0).

Zahl

Diese Abbildung zeigt . Es verwendet ein genaues Seitenverhältnis, um die Steigungen zu die links und rechts . In diesem Fall sind Exkursionen über im Vergleich zu Exkursionen unter stark untergewichtet .Λ1/54/5+1/500

Dies ist eine natürliche Funktion, die versucht werden muss, da Werte , die überschreiten, anders gewichtet werden als , die kleiner als . Berechnen wir den damit verbundenen Verlust und optimieren ihn anschließend.x0x0

Schreiben für die Verteilungsfunktion von und Einstellen , computeFXLα(m,x)=Λα(xm)

EF(Lα(m,X))=RΛα(xm)dF(x)=αRI(xm)(xm)dF(x)(1α)R(xm)I(x<m)dF(x)=αm(xm)dF(x)(1α)m(xm)dF(x).

Figur 2

Da in dieser Darstellung mit der Standardnormalverteilung variiert , ist die gesamte wahrscheinlichkeitsgewichtete Fläche von aufgetragen. (Die Kurve ist der Graph von .) Das Diagramm auf der rechten Seite für zeigt am deutlichsten den Effekt der Herabgewichtung der positiven Werte, denn ohne diese Herabgewichtung würde das Diagramm symmetrisch zum Ursprung sein. Das mittlere Diagramm zeigt das Optimum, bei dem die Gesamtmenge an blauer Tinte (die ) so gering wie möglich ist.mFΛ1/5Λ1/5(xm)dF(x)m=0EF(L1/5(m,X)) 

Diese Funktion ist differenzierbar und so können ihre Extrema durch Inspektion der kritischen Punkte gefunden werden. Die Anwendung der Kettenregel und des Fundamentalsatzes der Analysis, um die Ableitung in Bezug auf ergibtm

mEF(Lα(m,X))=α(0mdF(x))(1α)(0mdF(x))=F(m)α.

Für kontinuierliche Verteilungen hat dies immer eine Lösung die per Definition ein beliebiges Quantil von . Für nicht kontinuierliche Verteilungen hat dies möglicherweise keine Lösung, aber es gibt mindestens ein für das für alle und für alle gilt : dies auch (per Definition) ist ein Quantil .mαXmF(x)α<0x<mF(x)α0xmαX

Schließlich ist aufgrund von und klar, dass weder noch diesen Verlust minimieren. Das erschöpft die Inspektion der kritischen Punkte und zeigt, dass der Rechnung entspricht.α0α1mmΛα

Als Sonderfall ist der Verlust, der in der Frage.EF(2L1/2(m,X))=EF(|mx|)

whuber
quelle
Ich schätze den Aufwand, den Sie in die Darstellung des erwarteten Verlusts gesteckt haben, um den korrekten Punkt minimieren . Ich habe mich gefragt, wie ich das selbst für meine eigene Antwort machen soll, aber Ihre Erklärung ist gut. (+1)m
2
Sie haben bewiesen, dass Bilder 1000 Wörter wert sind. Danke @whuber =)
Cam.Davidson.Pilon
8

Dieser Artikel hat Ihre Antwort. Um genau zu sein, ist Die Verlustfunktion kann so interpretiert werden, dass die verschiedenen Wahrscheinlichkeitsmassenbereiche um durch die Subtraktion . Für den Median sind diese Massenbereiche gleich: wodurch die Verlustfunktion proportional (in der Erwartung ist die Konstante vernachlässigbar) zu was die gewünschte Schlussfolgerung für den Median ergibt.

L0.25(m,X)=|(Xm)(0.251{X>m})|.
0.250.251{X>m}
L0.5(m,X)=|(Xm)(0.51{X>m})|=|(Xm)×±0.5|,
|Xm|,

quelle
(+1) Gut gemacht! - Es war nicht klar, wo man nach diesem Wikipedia-Artikel suchen sollte. man musste an Quantilregression denken.
whuber
Danke, @Matthew, das ist ein großartiger Fund. Ich mag es , die Interpretation
auszugleichen
Ich verstehe immer noch nicht. Woher kommt das? Wenn X über dem Quantil liegt, wird 0,75 gewichtet, andernfalls mit 0,25? Nur das? |(0.25)1X>m)|(Xm)
IcannotFixThis