Wenn

9

Nehmen Sie den folgenden Aufbau an:
Es sei Zi=min{ki,Xi},i=1,...,n . Auch XiU[ai,bi],ai,bi>0 . Außerdem ist ki=cai+(1c)bi,0<c<1 dh ki ist eine konvexe Kombination der Grenzen der jeweiligen Träger. c ist allen i .

Ich glaube, ich habe die Verteilung von Zi richtig: Es ist eine gemischte Verteilung .
Es hat einen kontinuierlichen Teil,

Xi[ai,ki),Zi=XiPr(Zizi)=ziaibiai
und dann eine Diskontinuität und einen diskreten Teil, wo Wahrscheinlichkeitsmassenkonzentrate:
Pr(Zi=ki)=Pr(Xi>ki)=1Pr(Xiki)
=1kiaibiai=1(1c)(biai)biai=c

Also in allen

FZi(zi)={0zi<aiziaibiaiaizi<ki1kizi

während für die gemischte "diskrete / kontinuierliche" Masse / Dichte-Funktion außerhalb des Intervalls [a_i, k_i] 0 ist , hat sie einen kontinuierlichen Teil, der die Dichte eines einheitlichen U (a_i, b_i) , \ frac {1} ist. {b_i-a_i}, aber für a_i \ le z_i <k_i , und es konzentriert die positive Wahrscheinlichkeitsmasse c> 0 bei z_i = k_i .0[ai,ki]U(ai,bi)1biaiaizi<kic>0zi=ki

Insgesamt ergibt sich eine Einheit über die Realität.

Ich möchte in der Lage sein, die Verteilung und / oder Momente der Zufallsvariablen Sni=1nZi als n \ rightarrow \ infty abzuleiten oder etwas darüber zu sagen n.

Angenommen, wenn die unabhängig sind, sieht es so aus, als ob als . Kann ich diesen Teil auch nur annähernd "ignorieren"? Dann würde mir eine Zufallsvariable die im Intervall , der wie die Summe der zensierten Uniformen , auf dem Weg, "unzensiert" zu werden, und vielleicht ein zentraler Grenzwertsatz ... aber ich bin wahrscheinlich eher divergierend als konvergierend hier, Also irgendwelche Vorschläge?XiPr(Sn=inki)=cn0n[i=1nai,i=1nki)

PS: Diese Frage ist relevant. Sie leitet die Verteilung der Summe der zensierten Variablen ab , aber die Antwort von @Glen_b ist nicht das, was ich brauche. Ich muss diese Sache analytisch bearbeiten, auch wenn ich Näherungswerte verwende. Dies ist Forschung, also behandeln Sie sie bitte wie Hausaufgaben - allgemeine Vorschläge oder Verweise auf Literatur sind gut genug.

Alecos Papadopoulos
quelle
Wenn Sie das brauchen, schreiben Sie die Verteilung von als mit einem geeigneten , in dem eine Borel-Menge ist. μ Z i ( B ) = P ( Z iB ) = B g ( t )Zig B.μZi(B)=P(ZiB)=Bg(t)dt+cIB(ki)gB
Zen
@Zen Ich habe bereits in der Frage geschrieben, dass die Verteilung diskontinuierlich ist. Auch die RHS von macht deutlich, dass dieses für eine Dichte in , aber für eine Wahrscheinlichkeit für - und ich bevorzuge eine kompakte Notation. f [ a i , k i ) k iff[ai,ki)ki
Alecos Papadopoulos
Soweit ich weiß, existiert diese Notation mit als PDF und PMF nicht; und wir haben die richtige mathematische Sprache, um gemischte Verteilungen genau zu beschreiben. Ich bezweifle, dass diese Notation akzeptiert wird, wenn Sie Ihre Forschung veröffentlichen. Natürlich nur meine Meinung. Sie sollten es immer so machen, wie Sie es mögen. f
Zen
@Zen Publishing ist weit voraus - und Rezensenten runzeln die Stirn, wenn sie eine nicht etablierte Notation sehen. Dies ist nur eine Abkürzung, wenn man eine schrittweise Verteilung in vielen Zeilen beschreiben möchte. Es gibt kein "Argument dafür" und gegen die etablierte Notation, wie zum Beispiel die, die Sie in einem früheren Kommentar verwendet haben.
Alecos Papadopoulos

Antworten:

5

Ich würde Henrys Tipp folgen und Lyapunov mit überprüfen . Die Tatsache, dass die Verteilungen gemischt sind, sollte kein Problem sein, solange sich die und richtig verhalten. Die Simulation des speziellen Falls, in dem , , für jedes zeigt, dass die Normalität in Ordnung ist.δ=1aibiai=0bi=1ki=2/3i1

xbar <- replicate(10^4, mean(pmin(runif(10^4), 2/3)))
hist((xbar - mean(xbar)) / sd(xbar), breaks = "FD", freq = FALSE)
curve(dnorm, col = "blue", lwd = 2, add = TRUE)

CLT

Zen
quelle
In der Tat ziemlich normal. Gut zu wissen. Die üblichen Bedingungen für CLT waren hier nie ein Problem. Meine Frage war, ob es andere, vielleicht subtile Probleme gab, die das asymptotische Ergebnis verdrehten und eine modifizierte CLT erforderten. Ihre Simulation zeigt, dass die Wahrscheinlichkeit der diskreten Diskontinuität tatsächlich vernachlässigbar wird, wenn mehr Variablen in die Summe eingegeben werden.
Alecos Papadopoulos
Nichts spezielles, aber sie werfen keine Probleme auf. Denken Sie an sie als benommene endliche Zahlen, unabhängig vom Index . Sie können zunehmen oder abnehmen, wenn wachse (keine spezifische Regel), und keiner von ihnen ist unverhältnismäßig größer als die anderen ... sie repräsentieren Größenunterschiede von dennoch "vergleichbaren" Einheiten. So hält Lindebergs Zustand mit Sicherheitii
Alecos Papadopoulos
Nett. Viel Glück bei den nächsten Schritten. Sieht nach einem interessanten Problem aus.
Zen
3

Hinweise:

Unter der Annahme, dass fest ist und unabhängig sind, können Sie den Mittelwert und die Varianz jedes : zum Beispiel und du weißt . cXiμiσi2Ziμi=E[Zi]=cai+ki2+(1c)kiki=cai+(1c)bi

Wenn und nicht zu schnell wachsen, können Sie die Lyapunov- oder Lindeberg-Bedingungen verwenden , um den zentralen Grenzwertsatz mit der Schlussfolgerung anzuwenden, dass konvergiert in der Verteilung zu einer Standardnormalen oder im Sinne ist ungefähr normalverteilt mit dem Mittelwert und Varianz .aibi11nσi2(1nZi1nμi)1nZi1nμi1nσi2

Henry
quelle
Vielen Dank. Es gibt kein Problem mit den und , sie wachsen nicht mit dem Index, sie schwanken nur herum. Sie sagen also im Wesentlichen, dass die CLT auch Zufallsvariablen mit gemischten Verteilungen abdecken kann? aibi
Alecos Papadopoulos
Wenn zum Beispiel und fest wären, hätten Sie unabhängige, identisch verteilte Zufallsvariablen mit einer endlichen Varianz, sodass der zentrale Grenzwertsatz gelten würde. Ob dies eine Mischungsverteilung ist oder nicht, hat keinen Einfluss auf dieses Ergebnis. Was ich damit sagen möchte, ist, dass Sie dies auf Fälle ausweiten können, in denen die Zufallsvariablen unabhängig, aber nicht identisch verteilt sind, vorausgesetzt, die Mittelwerte und Abweichungen bleiben angemessen. aibi
Henry
2

Meine Hauptsorge bei dieser Frage war, ob man das CLT in dem von mir untersuchten Fall "wie gewohnt" anwenden kann. Benutzer @Henry behauptete, dass man kann, Benutzer @Zen zeigte es durch eine Simulation. So ermutigt, werde ich es jetzt analytisch beweisen.

Was ich zuerst tun werde, ist zu überprüfen, ob diese Variable mit der gemischten Verteilung eine "übliche" Momenterzeugungsfunktion hat. Bezeichne den erwarteten Wert von , seine Standardabweichung und die zentrierte und skalierte Version von mit . Bei Anwendung der Variablenänderungsformel stellen wir fest, dass der kontinuierliche Teil Die Momenterzeugungsfunktion von sollte sein μiZiσiZiZ~i=Ziμiσi

fZ~(z~i)=σifZ(zi)=σibiai
Z~i
M~i(t)=E(ez~it)=ez~itdFZ~(z~i)=a~ik~iσiez~itbiaidzi+cek~it

M~i(t)=σibiaiek~itea~itt+cek~it
mit
k~i=kiμiσi,a~i=aiμiσi

Wenn wir Primzahlen zur Bezeichnung von Ableitungen verwenden und die Momenterzeugungsfunktion korrekt angegeben haben, sollten wir seitdem ist eine zentrierte und skalierte Zufallsvariable. Und in der Tat, durch Derivate zu berechnen, L'Hopital-Regel Anwendung viele Male, (da der Wert des MGF bei Null muss über Grenzen berechnet werden) und algebraische Manipulationen zu tun, habe ich die ersten beiden Gleichheiten verifiziert. Die dritte Gleichstellung erwies sich als zu lästig, aber ich vertraue darauf, dass sie gilt.

M~i(0)=1,M~i(0)=E(Z~)=0M~i(0)=E(Z~i2)=Var(Z~i)=1

Wir haben also einen richtigen MGF. Wenn wir die Taylor-Expansion 2. Ordnung um Null nehmen, haben wir

M~(t)=M~(0)+M~(0)t+12M~(0)t2+o(t2)

M~(t)=1+12t2+o(t2)

Dies impliziert, dass die charakteristische Funktion (hier bezeichnet die imaginäre Einheit) .i

ϕ~(t)=1+12(it)2+o(t2)=112t2+o(t2)

Durch die Eigenschaften der charakteristischen Funktion haben wir, dass die charakteristische Funktion von gleich istZ~/n

ϕ~Z~/n(t)=ϕ~Z~(t/n)=1t22n+o(t2/n)

und da wir unabhängige Zufallsvariablen, die charakteristische Funktion des ist1ninZ~i

ϕ~1ninZ~i(t)=i=1nϕ~Z~(t/n)=i=1n(1t22n+o(t2/n))

Dann

limnϕ~1ninZ~i(t)=limn(1t22n)n=et2/2

durch wie die Zahl dargestellt wirde . Es kommt also vor, dass der letzte Term die charakteristische Funktion der Standardnormalverteilung ist, und nach Levys Kontinuitätssatz haben wir das

1ninZ~idN(0,1)

Welches ist die CLT. Beachten Sie, dass die Tatsache, dass die - Variablen nicht identisch verteilt sind, aus dem Blickfeld "verschwunden" ist, sobald wir ihre zentrierten und skalierten Versionen und die Taylor-Erweiterung 2. Ordnung ihres MGF / CHF betrachtet haben: Auf dieser Näherungsebene funktionieren diese Funktionen sind identisch, und alle Unterschiede werden in den übrigen Begriffen verdichtet, die asymptotisch verschwinden. Z

Die Tatsache, dass das eigenwillige Verhalten auf individueller Ebene aus allen einzelnen Elementen verschwindet, wenn wir das durchschnittliche Verhalten betrachten, wird meines Erachtens sehr gut anhand einer bösen Kreatur wie einer Zufallsvariablen mit einer gemischten Verteilung dargestellt.

Alecos Papadopoulos
quelle
Wirklich cool, Alecos. Mein Gefühl ist, dass das Argument von spezifischeren Bedingungen für die und abhängen sollte . Zum Beispiel: Bricht der Beweis, wenn schnell ist? (Ich weiß, dass dies in Ihrer Bewerbung nicht der Fall ist.) Was denken Sie? b i ( b i - a i ) 0aibi(biai)0
Zen
@Zen Das Problem bezüglich der Varianzen unabhängiger, aber nicht identisch verteilter Wohnmobile ist sehr subtil. Ich glaube nicht, dass ich es noch klar verstehe. Die bekannten Lyapunov oder Linde Bedingungen sind nur ausreichend für die CLT zu halten. Es gibt Fälle, in denen das CLT gilt, obwohl diese Bedingungen dies nicht tun. Ich denke also, wenn wir die Abweichungen nicht binden, gibt es keine einzige Antwort, und das Problem wird völlig fallspezifisch. Selbst Billingsleys Buch ist in dieser Angelegenheit nicht klar. Die Frage ist, wie der Rest aussehen wird und was wir darüber sagen können.
Alecos Papadopoulos