Extreme Value Theory - Show: Normal zu Gumbel

21

Das Maximum von iid Standardnormals konvergiert mit der Standard-Gumbel- Verteilung gemäß der Extremwerttheorie .X1,,Xn.

Wie können wir das zeigen?

Wir haben

P(maxXichx)=P(X1x,,Xnx)=P(X1x)P(Xnx)=F(x)n

Wir müssen Folgen von Konstanten finden / wählen so dass:einn>0,bnR

F(einnx+bn)nnG(x)=e-exp(-x)

Können Sie es lösen oder in der Literatur finden?

Es gibt einige Beispiele , jedoch nicht für den Normalfall:

Φ(einnx+bn)n=(12π-einnx+bne-y22dy)ne-exp(-x)
Emcor
quelle

Antworten:

23

Ein indirekter Weg ist folgender:
Für absolut kontinuierliche Verteilungen, Richard von Mises (in einem 1936 erschienenen Aufsatz "Die Verteilung der großen Valeure" , der in englischer Sprache reproduziert worden zu sein scheint? - in einer Ausgabe von 1964 mit ausgewählten Papers of his) hat die folgende ausreichende Bedingung für das Maximum einer Stichprobe zur Konvergenz mit dem Standard Gumbel, , geliefert :G(x)

Sei die gemeinsame Verteilungsfunktion von iid Zufallsvariablen und ihre gemeinsame Dichte. Dann wennn f ( x )F(x)nf(x)

limxF1(1)(ddx(1-F(x))f(x))=0X(n)dG(x)

Wir verwenden die übliche Notation für die Standardnormale und berechnen die Ableitung

ddx(1-Φ(x))ϕ(x)=-ϕ(x)2-ϕ(x)(1-Φ(x))ϕ(x)2=-ϕ(x)ϕ(x)(1-Φ(x))ϕ(x)-1

Beachten Sie, dass . Für die Normalverteilung ist . Also müssen wir das Limit bewertenF-1(1)=-ϕ(x)ϕ(x)=xF-1(1)=

limx(x(1-Φ(x))ϕ(x)-1)

Aber ist Verhältnis Mühle, und wir wissen , dass das Verhältnis der Mühle für die Standardnormal neigt zu als wächst. So 1/xx(1-Φ(x))ϕ(x)1/xx

limx(x(1-Φ(x))ϕ(x)-1)=x1x-1=0

und die ausreichende Bedingung ist erfüllt.

Die zugehörigen Reihen sind gegeben als

einn=1nϕ(bn),bn=Φ-1(1-1/n)

NACHTRAG

Dies ist aus ch. 10.5 des Buches HA David & HN Nagaraja (2003), "Order Statistics" (3D-Ausgabe) .

f ( t ) f ( t ) w ( t )ξein=F-1(ein) . Auch ist der Verweis auf de Haan "Haan, LD (1976) Proben Extreme: eine elementare Einführung Statistica Neerlandica, 30 (4), 161-172... " Aber Vorsicht , da einige der Notation unterschiedliche Inhalte in hat de Haan - Zum Beispiel ist in dem Buch die Wahrscheinlichkeitsdichtefunktion, während in de Haan die Funktion des Buches bedeutet (dh Mills Ratio). Auch de Haan prüft die bereits differenzierte ausreichende Kondition.f(t) f(t)w(t)

Bildbeschreibung hier eingeben

Alecos Papadopoulos
quelle
Ich bin nicht ganz sicher, ob ich Ihre Lösung verstanden habe. Sie haben also als die normale Standard-CDF angenommen. Ich bin gefolgt und bin damit einverstanden, dass die ausreichende Bedingung erfüllt ist. Aber wie wird die zugehörige Reihe und plötzlich von diesen gegeben? a n b nFeinnbn
Renrenthehamster
@renrenthehamster Ich denke, diese beiden Teile sind unabhängig voneinander angegeben (keine direkte Verbindung).
Emcor
Und wie könnte man die dazugehörige Serie erhalten? Wie auch immer, ich habe eine Frage zu diesem Problem (und allgemeiner zu anderen Distributionen, die über den normalen Standard hinausgehen)
geöffnet
@renrenthehamster Ich habe relevantes Material hinzugefügt. Ich glaube nicht, dass es für alle Fälle ein Standardrezept gibt, um diese Serien zu finden.
Alecos Papadopoulos
14

Die Frage stellt zwei Fragen: (1) Wie kann gezeigt werden, dass das Maximum konvergiert, in dem Sinne, dass (in der Verteilung) für geeignet gewählte Folgen konvergiert und auf die Standard-Gumbel-Verteilung und (2) wie man solche Sequenzen findet. ( X ( n ) - b n ) / a n ( a n ) ( b n )X(n)(X(n)bn)/an(an)(bn)

Das erste ist bekannt und in den Originalarbeiten zum Fisher-Tippett-Gnedenko-Theorem (FTG) dokumentiert. Die zweite scheint schwieriger zu sein; Das ist das Problem, das hier angesprochen wird.

Bitte beachte, um einige Behauptungen zu verdeutlichen, die an anderer Stelle in diesem Thread auftauchen

  1. Die maximale hat nicht konvergieren etwas: es divergiert (wenn auch sehr langsam).

  2. Es scheint unterschiedliche Konventionen bezüglich der Gumbel-Verteilung zu geben. Ich nehme die Konvention an, dass die CDF einer umgekehrten Gumbel-Verteilung in Maßstab und Position gegeben ist durch . Ein geeignet standardisiertes Maximum von iid-Normalvariablen konvergiert zu einer umgekehrten Gumbel-Verteilung.1exp(exp(x))


Intuition

Wenn die mit gemeinsamer Verteilungsfunktion iid sind , die Verteilung des maximalen ist , F X ( n )XiFX(n)

Fn(x)=Pr(X(n)x)=Pr(X1x)Pr(X2x)Pr(Xnx)=Fn(x).

Wenn die Unterstützung von keine Obergrenze hat, wie bei einer Normalverteilung, bewegt sich die Folge von Funktionen unbegrenzt für immer nach rechts:F nFFn

Abbildung 1

Es sind Teilgraphen von für gezeigt. n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16Fnn=1,2,22,24,28,216

Um die Formen dieser Verteilungen zu untersuchen, können wir jede um einen gewissen Betrag nach links verschieben und um , um sie vergleichbar zu machen.a nbneinn

Figur 2

Jedes der vorherigen Diagramme wurde verschoben, um den Median bei und den Bereich der Einheitslänge zwischen den Quartilen festzulegen.0

FTG behauptet, dass die Sequenzen und so gewählt werden können, dass diese Verteilungsfunktionen bei jedem punktweise bis zu einer gewissen Extremwertverteilung konvergieren , bis hin zu Maßstab und Position. Wenn eine Normalverteilung ist, die besondere Begrenzung Extremwertverteilung ist ein Gumbel umgekehrt, bis zu Lage und Maßstab.( b n ) x F(einn)(bn)xF


Lösung

Es ist verlockend, den zentralen Grenzwertsatz zu emulieren, indem man standardisiert , dass er einen Einheitsmittelwert und eine Einheitsvarianz aufweist. Dies ist jedoch teilweise unangemessen, da FTG auch für (kontinuierliche) Verteilungen gilt, die keinen ersten oder zweiten Moment haben. Verwenden Sie stattdessen ein Perzentil (wie den Median), um die Position zu bestimmen, und eine Differenz von Perzentilen (wie den IQR), um die Streuung zu bestimmen. (Dieser allgemeine Ansatz sollte erfolgreich sein, und für eine kontinuierliche Verteilung zu finden.)a n b nFneinnbn

Für die Standard-Normalverteilung stellt sich dies als einfach heraus! Es sei . Ein Quantil von , das entspricht, ist ein beliebiger Wert für den . In Erinnerung an die Definition von lautet die LösungF n q x q F n ( x q ) = q F n ( x ) = F n ( x )0<q<1FnqxqFn(xq)=qFn(x)=Fn(x)

xq;n=F-1(q1/n).

Deshalb dürfen wir setzen

bn=x1/2;n, einn=x3/4;n-x1/4;n; Gn(x)=Fn(einnx+bn).

Denn durch den Bau, der Median der ist und seine IQB ist , der Median des Grenzwertes von (die eine Version eines umgekehrten Gumbel ist) muss und sein IQB muss . Der Parameter scale sei und der Parameter location sei . Da der Median und der IQR leicht zu , müssen die Parameter seinGn01Gn01βαα+βLogLog(2)β(LogLog(4)-LogLog(4/3))

α=LogLog2LogLog(4/3)-LogLog(4); β=1LogLog(4)-LogLog(4/3).

Es ist nicht notwendig für und werden genau diese Werte: sie brauchen nur annähernd sie, sofern die Grenze von noch diese umgekehrt Gumbelverteilung. Eine einfache (aber mühsame) Analyse für eine Standardnormale zeigt, dass die NäherungeneinnbnGnF

einn=Log((4Log2(2))/(Log2(43)))22Log(n), bn=2Log(n)-Log(Log(n))+Log(4πLog2(2))22Log(n)

wird gut funktionieren (und sind so einfach wie möglich).

Figur 3

Die hellblauen Kurven sind Teilgraphen von für Verwendung der ungefähren Folgen und . Die dunkelrote Linie zeigt die umgekehrte Gumbel-Verteilung mit den Parametern und . Die Konvergenz ist klar (obwohl die Konvergenzrate für negatives merklich langsamer ist).Gnn=2,26,211,216einnbnαβx


Verweise

BV Gnedenko, Über die einschränkende Verteilung der maximalen Laufzeit in einer zufälligen Reihe . In Kotz und Johnson, Durchbrüche in Statistik Band I: Grundlagen und grundlegende Theorie, Springer, 1992. Übersetzt von Norman Johnson.

whuber
quelle
@Vossler Die Formel in Alecos 'Beitrag für konvergiert gegen als . Es verhält sich wie für großes . 0 n ( 2 log ( n ) - log ( 2 π ) ) - 1 / 2 neinn0n(2Log(n)-Log(2π))-1/2n
whuber
Ja, das stimmt, ich habe dies kurz nach dem Posten meines Kommentars festgestellt und es sofort gelöscht. Vielen Dank!
Vossler
@ Jess Ich hatte gehofft, dass diese Antwort so verstanden werden würde, dass sie unter anderem zeigt, dass es keine "die" Formel gibt: Es gibt unzählige korrekte Formeln für undb n .einnbn.
Whuber
@Jess Das ist besser, weil die Demonstration eines alternativen Ansatzes die Motivation war, diese Antwort zu schreiben. Ich verstehe Ihre Unterstellung nicht, dass ich es für "nutzlos hielt, eine Antwort aufzuschreiben", weil ich das hier ausdrücklich getan habe.
Whuber
@Jess Ich kann dieses Gespräch nicht fortsetzen, weil es völlig einseitig ist: Ich muss noch alles erkennen, was ich in einer Ihrer Charakterisierungen geschrieben habe. Ich höre auf, während ich zurück bin.
Whuber