Sei die Ordnungsstatistik einer iid-Stichprobe der Größe n aus \ exp (\ lambda) . Angenommen, die Daten werden zensiert, sodass nur die obersten (1-p) \ mal 100% Prozent der Daten angezeigt werden, dh X _ {(\ lfloor pn \ rfloor)}, X _ {(\ lfloor pn \ rfloor + 1)} , \ ldots, X _ {(n)} \,. Setzen Sie m = \ lfloor pn \ rfloor , was ist die asymptotische Verteilung von \ left (X _ {(m)}, \ frac {\ sum_ {i = m + 1} ^ n X _ {(i)}} {(nm) } \Recht)?
Dies ist etwas im Zusammenhang mit dieser Frage und diese und auch geringfügig auf diese Frage.
Jede Hilfe wäre dankbar. Ich habe verschiedene Ansätze ausprobiert, konnte aber nicht viel erreichen.
Antworten:
Da nur ein Skalierungsfaktor ist, wählen Sie ohne Verlust der Allgemeinheit Maßeinheiten, die , und machen Sie die zugrunde liegende Verteilungsfunktion mit der Dichte .λ λ=1 F(x)=1−exp(−x) f(x)=exp(−x)
Aus Überlegungen, die denen des zentralen Grenzwertsatzes für Stichprobenmediane entsprechen , ist asymptotisch normal mit dem Mittelwert und der VarianzX(m) F−1(p)=−log(1−p)
Aufgrund der memorylosen Eigenschaft der Exponentialverteilung wirken die Variablen wie die Ordnungsstatistik einer Zufallsstichprobe von die aus , zu der wurde hinzugefügt. Schreiben(X(m+1),…,X(n)) n−m F X(m)
für ihre mittleren, ist es sofort , dass der Mittelwert von die Mittelwert ist (gleich ) und die Varianz von ist mal die Varianz von (entspricht auch ). Der zentrale Grenzwertsatz impliziert, dass das standardisierte asymptotisch Standard Normal ist. Da bedingt unabhängig von , haben wir gleichzeitig die standardisierte Version von , die asymptotisch Standard Normal wird und nicht mit korreliert . Das ist,Y F 1 Y 1/(n−m) F 1 Y Y X(m) X(m) Y
hat asymptotisch eine bivariate Standardnormalverteilung.
Der Grafikbericht über simulierte Daten für Stichproben von ( Iterationen) und . Eine Spur positiver Schiefe bleibt bestehen, aber der Ansatz zur bivariaten Normalität zeigt sich in der fehlenden Beziehung zwischen und und der Nähe der Histogramme zur Standardnormaldichte (gezeigt in rote Punkte). 500 p = 0,95 Y - X ( m ) X ( m )n=1000 500 p=0.95 Y−X(m) X(m)
Die Kovarianzmatrix der standardisierten Werte (wie in Formel ) für diese Simulation war bequem nahe an der Einheitsmatrix, die sie approximiert.( 0,967 - 0,021 - 0,021 1,010 ) ,(1)
Dern p
R
Code, der diese Grafiken erstellt hat, kann leicht geändert werden, um andere Werte von , und Simulationsgröße zu untersuchen.pquelle