Dies ist ein Übungsproblem für eine Zwischenprüfung. Das Problem ist ein Beispiel für einen EM-Algorithmus. Ich habe Probleme mit Teil (f). Ich liste die Teile (a) - (e) zur Vervollständigung auf und falls ich früher einen Fehler gemacht habe.
Sei unabhängige exponentielle Zufallsvariablen mit der Rate . Leider werden die tatsächlichen Werte nicht beobachtet, und wir beobachten nur, ob die Werte innerhalb bestimmter Intervalle liegen. Sei , und für . Die beobachteten Daten bestehen aus .X1,…,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2}G3j=1{Xj>2}j=1,…,n(G1j,G2j,G3j)
(a) Geben Sie die beobachtete Datenwahrscheinlichkeit an:
L(θ|G)=∏j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=∏j=1n(1−e−θ)G1j(e−θ−e−2θ)G2j(e−2θ)G3j
(b) Geben Sie die vollständige Datenwahrscheinlichkeit an
L(θ|X,G)=∏j=1n(θe−θxj)G1j(θe−θxj)G2j(θe−θxj)G3j
(c) Leiten Sie die Vorhersagedichte der latenten Variablenf(xj|G,θ)
f( xj| G,θ)= fX., G( xj, g)fG( g)= θ e- θ xj1 { xj∈ Region r st G.r j= 1 }( 1 - e- θ)G1 j( e- θ- e- 2 θ)G2 j( e- 2 θ)G3 j
(d) E-Schritt. Geben Sie die FunktionQ ( θ , θich)
Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)−N2log(e−θ−e−2θ)−N3loge−2θ=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)−N2log(e−θ( 1−e−θ) ) +2θN3=nlogθ -θ∑j=1nE [Xj| G,θi] -N1log( 1 - e- θ) +θ N.2- N.2Log( 1 - e- θ) +2θ N.3
wobeiN.1=∑nj=1g1j,N2=∑nj=1g2j,N3=∑nj=1g3j
(e) Geben Sie Ausdrücke für für . r = 1 , 2 , 3E[Xj|Grj=1,θi]r=1,2,3
Ich werde meine Ergebnisse auflisten, von denen ich mir ziemlich sicher bin, dass sie richtig sind, aber die Ableitungen wären für diese bereits lange Frage etwas lang:
E[Xj|G1j=1,θi]E[Xj|G2j=1,θi]E[Xj|G3j=1,θi]=(11−e−θi)(1θi−e−θi(1+1/θi))=(1e−θi−e−2θi)(e−θi(1+1/θi)−e−2θi(2+1/θi))=(1e−2θi)(e−2θi(2+1/θi))
Dies ist der Teil, an dem ich festhalte, und es könnte an einem früheren Fehler liegen:
(f) M-Schritt. Finden Sie das , das maximiertQ ( θ , θ i )θQ(θ,θi)
Nach dem Gesetz der totalen Erwartung haben wir
DafürE[Xj|G,θi]=(1θi−e−θi(1+1/θi))+(e−θi(1+1/θi)−e−2θi(2+1/θi))+(e−2θi(2+1/θi))=1/θi
Q(θ,θi)∂Q(θ,θi)∂θ=nlogθ−θ∑j=1nE[Xj|G,θi]−N1log(1−e−θ)+θN2−N2log(1−e−θ)+2θN3=nlogθ−θnθi−N1log(1−e−θ)+θN2−N2log(1−e−θ)+2θN3=nθ−nθi−(N1+N2)e−θ1 - e- θ+ N.2+ 2 N.3
Als nächstes sollte ich dies auf Null setzen und nach lösen , aber ich habe dies sehr lange versucht und ich kann nicht nach lösen !θθθ
Antworten:
Die vollständige Datenwahrscheinlichkeit sollte nicht G! Es sollte einfach die Wahrscheinlichkeit von wenn die exponentiell sind. Beachten Sie, dass sich die vollständige Datenwahrscheinlichkeit, wie Sie sie geschrieben haben, zu einer exponentiellen Wahrscheinlichkeit vereinfacht, da nur eines der kann. Wenn Sie die in der vollständigen Datenwahrscheinlichkeit belassen, werden Sie jedoch später durcheinander gebracht. X G r j G.θ X. Gr j G
In Teil (d) sollte die Erwartung der vollständigen Datenprotokollwahrscheinlichkeit und nicht der beobachteten Datenprotokollwahrscheinlichkeit berücksichtigt werden.
Sie sollten auch nicht das Gesetz der totalen Erwartung anwenden! Denken Sie daran, dass G beobachtet wird und nicht zufällig ist. Sie sollten daher nur eine dieser bedingten Erwartungen für jedes ausführen . Ersetzen Sie diese bedingte Erwartung einfach durch den Term und führen Sie dann den M-Schritt aus.X ( i ) jX.j X.( i )j
quelle
Basierend auf den Kommentaren von @ jsk werde ich versuchen, meine Fehler zu beheben:
wir nach lösen, erhalten wirθ ( i + 1 ) = nθ θ(i+1)=nN1A+N2B+N3C
quelle