Ich verstehe diese Frage als die Frage, wie man zu einer Verlustfunktion kommen kann, die ein bestimmtes Quantil als Verlustminimierer liefert, unabhängig von der zugrunde liegenden Verteilung. Es wäre daher unbefriedigend, nur die Analyse in Wikipedia oder anderswo zu wiederholen, die zeigt, dass diese bestimmte Verlustfunktion funktioniert.
Beginnen wir mit etwas Bekanntem und Einfachem.
Sie sprechen davon, einen "Ort" x∗ relativ zu einer Verteilung oder einem Datensatz F . Es ist beispielsweise bekannt, dass der Mittelwert x¯ den erwarteten quadratischen Restwert minimiert; das heißt, es ist ein Wert für den
LF(x¯)=∫R(x−x¯)2dF(x)
ist so klein wie möglich. Ich habe diese Notation verwendet, um uns daran zu erinnern, dass aus einem Verlust abgeleitet ist , dass es durch F bestimmt wird , aber am wichtigsten ist, dass es von der Zahl ˉ x abhängt .LFx¯
Der übliche Weg zu zeigen , dass minimiert jede Funktion beginnt mit der Funktion des Wertes zeigt nicht abnimmt , wenn x * wird durch ein wenig verändert. Ein solcher Wert wird als kritischer Punkt der Funktion bezeichnet.x∗x∗
Welche Art von Verlustfunktion würde dazu führen, dass ein Perzentil F - 1 ( α ) ein kritischer Punkt ist? Der Verlust für diesen Wert wäreΛF−1(α)
LF(F−1(α))=∫RΛ(x−F−1(α))dF(x)=∫10Λ(F−1(u)−F−1(α))du.
Damit dies ein kritischer Punkt ist, muss seine Ableitung Null sein. Da wir nur eine Lösung zu finden versuchen, werden wir nicht unterbrechen , um zu sehen , ob die Manipulationen legitim sind: wir werden technische Details ( zum Beispiel, ob wir wirklich unterscheiden können überprüfen planen , usw. ) am Ende. SomitΛ
0=L′F(x∗)=L′F(F−1(α))=−∫10Λ′(F−1(u)−F−1(α))du=−∫α0Λ′(F−1(u)−F−1(α))du−∫1αΛ′(F−1(u)−F−1(α))du.(1)
Auf der linken Seite ist das Argument von negativ, während es auf der rechten Seite positiv ist. Ansonsten haben wir wenig Kontrolle über die Werte dieser Integrale, da F jede Verteilungsfunktion sein könnte. Folglich besteht unsere einzige Hoffnung darin, Λ ' nur vom Vorzeichen seines Arguments abhängig zu machen , andernfalls muss es konstant sein.ΛFΛ′
Dies impliziert, dass stückweise linear ist, möglicherweise mit unterschiedlichen Steigungen links und rechts von Null. Es ist klar, dass es abnehmen sollte, wenn man sich Null nähert - es ist immerhin ein Verlust und kein Gewinn . Darüber hinaus ändert eine erneute Skalierung von Λ durch eine Konstante ihre Eigenschaften nicht, so dass wir uns frei fühlen können, die Neigung der linken Hand auf - 1 zu setzen . Sei τ > 0 die rechte Steigung. Dann vereinfacht sich ( 1 ) zuΛΛ−1τ>0(1)
0=α−τ(1−α),
woher die einzigartige Lösung ist, bis zu einem positiven Vielfachen,
Λ(x)={−x, x≤0α1−αx, x≥0.
Multipliziert man diese (natürliche) Lösung mit , um den Nenner zu löschen, erhält man die in der Frage dargestellte Verlustfunktion.1−α
Natürlich sind alle unsere Manipulationen mathematisch legitim, wenn diese Form hat. Λ