Zufallsvariable definiert als A mit 50% Chance und B mit 50% Chance

8

Hinweis: Dies ist ein Hausaufgabenproblem. Bitte geben Sie mir nicht die ganze Antwort!

Ich habe zwei Variablen, A und B, mit Normalverteilungen (Mittelwerte und Varianzen sind bekannt). Angenommen, C ist definiert als A mit 50% Chance und B mit 50% Chance. Wie würde ich nachweisen, ob C auch normal verteilt ist, und wenn ja, wie hoch sein Mittelwert und seine Varianz sind?

Ich bin nicht sicher, wie ich die PDFs von A und B auf diese Weise kombinieren soll, aber idealerweise besteht mein Angriffsplan darin, das PDF von C abzuleiten und zu zeigen, ob es ein a ist oder nicht, wenn jemand mich in die richtige Richtung weisen kann Variation des normalen PDF.

Blaues Feuer
quelle
2
Vielleicht sehen Sie Wikipedia über "Mischungsverteilung".
BruceET
6
Ein Diagramm könnte einen guten Hinweis darauf geben, ob normal verteilt ist. C
Kodiologe
4
Das schnelle Zeichnen der PDF-Datei einiger Fälle zeigt, dass normalerweise nicht normal ist: Es kann zwei Modi haben. Der Spaßteil besteht bei der Erlangung eine vollständige Charakterisierung wenn ist normalverteilt. CC
whuber
4
Ich finde es immer einfacher, mit der CDF einer Zufallsvariablen zu arbeiten als mit der PDF.
BallpointBen
5
Und als Hinweis sollten Sie in Betracht ziehen, zufällig jemanden aus der Bevölkerung zu ziehen, der aus allen Babys unter einem Jahr und allen NBA-Spielern besteht. Würden Sie erwarten, jemanden zu finden, der ungefähr einen Meter groß ist?
BallpointBen

Antworten:

8

Hoffentlich ist Ihnen klar, dass C nicht garantiert normal ist. Ein Teil Ihrer Frage war jedoch, wie Sie das PDF aufschreiben. @BallpointBen gab Ihnen einen Hinweis. Wenn das nicht genug ist, hier noch ein paar Spoiler ...

Man beachte, dass C geschrieben werden kann als: für ein Bernoulli-Zufalls- mit mit unabhängig von . Dies ist mehr oder weniger die mathematische Standardübersetzung der englischen Aussage "C ist A mit 50% Chance und B mit 50% Chance".

C=TA+(1T)B
TP(T=0)=P(T=1)=1/2T(A,B)

Nun scheint es schwierig zu sein, das PDF von C direkt daraus zu bestimmen, aber Sie können Fortschritte indem Sie die Verteilungsfunktion von C . Sie können das Ereignis in zwei Unterereignisse (abhängig vom Wert von ) aufteilen , um zu schreiben ::FCCXT

FC(x)=P(Cx)=P(T=0 and Cx)+P(T=1 and C x)

und beachten Sie, dass Sie durch die Definition von C und die Unabhängigkeit von T und B:

P(T=0 and Cx)=P(T=0 and Bx)=12P(Bx)=12FB(x)

Sie sollten in der Lage sein, ein ähnliches Ergebnis im Fall zu verwenden, um in Bezug auf und zu schreiben . Um das PDF von C zu erhalten, differenzieren einfach in Bezug auf x.T=1FCFAFBFC

KA Buhr
quelle
1
Bemerkenswert ist , folgt aus dieser Antwort , dass könnte normal sein, zB wenn gleich verteilt ist. C A,B
Mees de Vries
8

Die Simulation einer zufälligen 50-50-Mischung aus und ist unten dargestellt. Simulation in R.Norm(μ=90,σ=2)Norm(μ=100,σ=2)

set.seed(827);  m = 10^6
x1 = rnorm(m, 100, 2);  x2 = rnorm(m, 90, 2)
p = rbinom(m, 1, .5)
x = x1;  x[p==1] = x2[p==1]
hist(x, prob=T, col="skyblue2", main="Random 50-50 Mixture of NORM(90,2) and NORM(100,2)")
  curve(.5*(dnorm(x, 100, 2) + dnorm(x, 90, 2)), add=T, col="red", lwd=2)

Geben Sie hier die Bildbeschreibung ein

BruceET
quelle
7

Eine Möglichkeit, daran zu arbeiten, besteht darin, sie zu analysieren, da die Varianz gegen 0 tendiert. Auf diese Weise erhalten Sie eine Bernoulli-ähnliche Verteilung, die (eindeutig) keine Normalverteilung ist.

André Costa
quelle
1
Ich habe nicht als Kommentar gepostet, weil ich nicht genug Ruf habe
André Costa
1
Trotzdem ein guter Vorschlag. (+1)
BruceET
1

Dies ist die Art von Problem, bei dem es sehr hilfreich ist, das Konzept der CDF, der kumulativen Wahrscheinlichkeitsverteilungsfunktion, von Zufallsvariablen zu verwenden, das völlig unnötige Konzept, das Professoren nur mit einbeziehen, um Studenten zu verwirren, die gerne nur PDFs verwenden.

Per Definition entspricht der Wert der CDF einer Zufallsvariablen der Wahrscheinlichkeit, dass nicht größer als die reelle Zahl ist, Das Gesetz der Gesamtwahrscheinlichkeit sagt uns nun, dass wenn gleich wahrscheinlich mit einer Zufallsvariablen oder einer Zufallsvariablen identisch ist , oder mit anderen Worten FX(α)XXα

FX(α)=P{Xα}, <α<.
XAB
P{Xα}=12P{Aα}+12P{Bα},
FX(α}=12FA(α}+12FB(α}.
wir uns daran erinnern, wie langweilig Ihr Professor darüber geredet hat, wie für kontinuierliche Zufallsvariablen das PDF die Ableitung der CDF ist, erhalten wir das eine Ihrer Fragen beantwortet. Können Sie für den Sonderfall der normalen Zufallsvariablen und herausfinden, ob eine normale Dichte für ergibt oder nicht? Wenn Sie mit Begriffen vertraut sind wie können Sie herausfinden, indem Sie die rechte Seite von für in
(1)fX(α}=12fA(α}+12fB(α}
AB(1)X
(2)E[X]=αfX(α}dα,
(1)fX(α)(2)und wenn man über den Ausdruck nachdenkt, was ist in Bezug auf und ?E[X]E[A]E[B]
Dilip Sarwate
quelle
1

C ist nicht normalverteilt, es sei denn, und sind identisch verteilt. Wenn und jedoch identisch verteilt sind, wird auch identisch verteilt.ABABC

Beweis

Sei , und die kumulativen Verteilungsfunktionen (CDFs) von A, B bzw. C und , und ihre Wahrscheinlichkeitsdichtefunktionen (PDFs), dhFAFBFCfAfBfC

FA(x)=Pr(A<x),FB(x)=Pr(B<x),FC(x)=Pr(C<x),fA(x)=ddxFA(x),fB(x)=ddxFB(x), andfC(x)=ddxFC(x).

Wir haben auch zwei Veranstaltungen:

  • Γ1 , wenn als definiert ist , was mit der Wahrscheinlichkeit auftrittCAγ
  • Γ2 , wenn als definiert ist , was mit der Wahrscheinlichkeit auftrittCB1γ

Nach dem Gesetz der Gesamtwahrscheinlichkeit ,

FC(x)=Pr(C<x)=Pr(C<x | Γ1)Pr(Γ1)+Pr(C<x | Γ2)Pr(Γ2)=Pr(A<x)Pr(Γ1)+Pr(B<x)Pr(Γ2)=γFA(x)+(1γ)FB(x).

Deshalb,

fC(x)=ddxFC(x)=ddx(γFA(x)+(1γ)FB(x))=γ(ddxFA(x))+(1γ)(ddxFB(x))=γfA(x)+(1γ)fB(x),

und daγ=0.5,

fC(x)=0.5fA(x)+0.5fB(x).

Da das PDF einer Normalverteilung eine positive Gaußsche Funktion ist und die Summe zweier möglicher Gaußscher Funktionen genau dann eine positive Gaußsche Funktion ist, wenn und nur wenn die beiden Gaußschen Funktionen linear abhängig sind, wird genau dann normalverteilt, wenn und sind identisch verteilt.CAB

Wenn und identisch verteilt sind, ist , so dass auch identisch verteilt ist.ABfA(x)=fB(x)=fC(x)C

Hallo Auf Wiedersehen
quelle
2
Dies ist ein guter Punkt, aber glauben Sie nicht, dass es mehr helfen würde, zu erklären, warum dieses Ergebnis gilt, anstatt es nur zu behaupten? Könnten Sie eine einfache oder klare oder intuitive Erklärung anbieten?
whuber
@whuber Besser?
HelloGoodbye