Ein indirekter Weg ist folgender:
Für absolut kontinuierliche Verteilungen, Richard von Mises (in einem 1936 erschienenen Aufsatz "Die Verteilung der großen Valeure" , der in englischer Sprache reproduziert worden zu sein scheint? - in einer Ausgabe von 1964 mit ausgewählten Papers of his) hat die folgende ausreichende Bedingung für das Maximum einer Stichprobe zur Konvergenz mit dem Standard Gumbel, , geliefert :G(x)
Sei die gemeinsame Verteilungsfunktion von iid Zufallsvariablen und ihre gemeinsame Dichte. Dann wennn f ( x )F(x)nf(x)
limx→F−1(1)(ddx(1−F(x))f(x))=0⇒X(n)→dG(x)
Wir verwenden die übliche Notation für die Standardnormale und berechnen die Ableitung
ddx(1−Φ(x))ϕ(x)=−ϕ(x)2−ϕ′(x)(1−Φ(x))ϕ(x)2=−ϕ′(x)ϕ(x)(1−Φ(x))ϕ(x)−1
Beachten Sie, dass . Für die Normalverteilung ist . Also müssen wir das Limit bewertenF-1(1)=∞−ϕ′(x)ϕ(x)=xF−1(1)=∞
limx→∞(x(1−Φ(x))ϕ(x)−1)
Aber ist Verhältnis Mühle, und wir wissen , dass das Verhältnis der Mühle für die Standardnormal neigt zu als wächst. So 1/xx(1−Φ(x))ϕ(x)1/xx
limx→∞(x(1−Φ(x))ϕ(x)−1)=x1x−1=0
und die ausreichende Bedingung ist erfüllt.
Die zugehörigen Reihen sind gegeben als
an=1nϕ(bn),bn=Φ−1(1−1/n)
NACHTRAG
Dies ist aus ch. 10.5 des Buches HA David & HN Nagaraja (2003), "Order Statistics" (3D-Ausgabe) .
f ( t ) f ( t ) w ( t )ξa=F−1(a) . Auch ist der Verweis auf de Haan "Haan, LD (1976) Proben Extreme: eine elementare Einführung Statistica Neerlandica, 30 (4), 161-172... " Aber Vorsicht , da einige der Notation unterschiedliche Inhalte in hat de Haan - Zum Beispiel ist in dem Buch die Wahrscheinlichkeitsdichtefunktion, während in de Haan die Funktion des Buches bedeutet (dh Mills Ratio). Auch de Haan prüft die bereits differenzierte ausreichende Kondition.f(t) f(t)w ( t )
Die Frage stellt zwei Fragen: (1) Wie kann gezeigt werden, dass das Maximum konvergiert, in dem Sinne, dass (in der Verteilung) für geeignet gewählte Folgen konvergiert und auf die Standard-Gumbel-Verteilung und (2) wie man solche Sequenzen findet. ( X ( n ) - b n ) / a n ( a n ) ( b n )X(n) (X(n)−bn)/an (an) (bn)
Das erste ist bekannt und in den Originalarbeiten zum Fisher-Tippett-Gnedenko-Theorem (FTG) dokumentiert. Die zweite scheint schwieriger zu sein; Das ist das Problem, das hier angesprochen wird.
Bitte beachte, um einige Behauptungen zu verdeutlichen, die an anderer Stelle in diesem Thread auftauchen
Die maximale hat nicht konvergieren etwas: es divergiert (wenn auch sehr langsam).
Es scheint unterschiedliche Konventionen bezüglich der Gumbel-Verteilung zu geben. Ich nehme die Konvention an, dass die CDF einer umgekehrten Gumbel-Verteilung in Maßstab und Position gegeben ist durch . Ein geeignet standardisiertes Maximum von iid-Normalvariablen konvergiert zu einer umgekehrten Gumbel-Verteilung.1−exp(−exp(x))
Intuition
Wenn die mit gemeinsamer Verteilungsfunktion iid sind , die Verteilung des maximalen ist , F X ( n )Xi F X(n)
Wenn die Unterstützung von keine Obergrenze hat, wie bei einer Normalverteilung, bewegt sich die Folge von Funktionen unbegrenzt für immer nach rechts:F nF Fn
Es sind Teilgraphen von für gezeigt. n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16Fn n=1,2,22,24,28,216
Um die Formen dieser Verteilungen zu untersuchen, können wir jede um einen gewissen Betrag nach links verschieben und um , um sie vergleichbar zu machen.a nbn einn
Jedes der vorherigen Diagramme wurde verschoben, um den Median bei und den Bereich der Einheitslänge zwischen den Quartilen festzulegen.0
FTG behauptet, dass die Sequenzen und so gewählt werden können, dass diese Verteilungsfunktionen bei jedem punktweise bis zu einer gewissen Extremwertverteilung konvergieren , bis hin zu Maßstab und Position. Wenn eine Normalverteilung ist, die besondere Begrenzung Extremwertverteilung ist ein Gumbel umgekehrt, bis zu Lage und Maßstab.( b n ) x F( an) ( bn) x F
Lösung
Es ist verlockend, den zentralen Grenzwertsatz zu emulieren, indem man standardisiert , dass er einen Einheitsmittelwert und eine Einheitsvarianz aufweist. Dies ist jedoch teilweise unangemessen, da FTG auch für (kontinuierliche) Verteilungen gilt, die keinen ersten oder zweiten Moment haben. Verwenden Sie stattdessen ein Perzentil (wie den Median), um die Position zu bestimmen, und eine Differenz von Perzentilen (wie den IQR), um die Streuung zu bestimmen. (Dieser allgemeine Ansatz sollte erfolgreich sein, und für eine kontinuierliche Verteilung zu finden.)a n b nFn einn bn
Für die Standard-Normalverteilung stellt sich dies als einfach heraus! Es sei . Ein Quantil von , das entspricht, ist ein beliebiger Wert für den . In Erinnerung an die Definition von lautet die LösungF n q x q F n ( x q ) = q F n ( x ) = F n ( x )0 < q< 1 Fn q xq Fn( xq) = q Fn( x ) = Fn( x )
Deshalb dürfen wir setzen
Denn durch den Bau, der Median der ist und seine IQB ist , der Median des Grenzwertes von (die eine Version eines umgekehrten Gumbel ist) muss und sein IQB muss . Der Parameter scale sei und der Parameter location sei . Da der Median und der IQR leicht zu , müssen die Parameter seinGn 0 1 Gn 0 1 β α α + βLogLog( 2 ) β( logLog( 4 ) - logLog( 4 / 3 ) )
Es ist nicht notwendig für und werden genau diese Werte: sie brauchen nur annähernd sie, sofern die Grenze von noch diese umgekehrt Gumbelverteilung. Eine einfache (aber mühsame) Analyse für eine Standardnormale zeigt, dass die Näherungeneinn bn Gn F
wird gut funktionieren (und sind so einfach wie möglich).
Die hellblauen Kurven sind Teilgraphen von für Verwendung der ungefähren Folgen und . Die dunkelrote Linie zeigt die umgekehrte Gumbel-Verteilung mit den Parametern und . Die Konvergenz ist klar (obwohl die Konvergenzrate für negatives merklich langsamer ist).Gn n = 2 , 26, 211, 216 ein′n b′n α β x
Verweise
BV Gnedenko, Über die einschränkende Verteilung der maximalen Laufzeit in einer zufälligen Reihe . In Kotz und Johnson, Durchbrüche in Statistik Band I: Grundlagen und grundlegende Theorie, Springer, 1992. Übersetzt von Norman Johnson.
quelle