EM wird nicht benötigt, anstatt eine numerische Methode zu verwenden, da EM auch eine numerische Methode ist. Es ist also kein Ersatz für Newton-Raphson. EM ist für den speziellen Fall vorgesehen, dass in Ihrer Datenmatrix Werte fehlen. Man betrachte eine Stichprobe der bedingten Dichte . Dann ist die log-Wahrscheinlichkeit dafür
Nehmen wir nun an, Sie haben keinen vollständigen Datensatz, so dass aus beobachteten Daten besteht und fehlende (oder latente) Variablen , so dass . Dann ist die Log-Wahrscheinlichkeit für die beobachteten Daten
X= ( X1, . . . , Xn)fX| Θ( x | θ )
l ( θ ; X) = l o gfX| Θ( X| θ)
XY.ZX= ( Y, Z)lo b s( θ , Y) = l o g∫fX| Θ( Y, z| θ) νz( dz)
Im Allgemeinen können Sie dieses Integral nicht direkt berechnen und Sie werden nicht erhalten eine geschlossene Lösung für . Zu diesem Zweck verwenden Sie die EM-Methode. Es gibt zwei Schritte, die mal durchlaufen werden . In diesem Schritt sind dies die Erwartungsschritte, in denen Sie
wobei die Schätzung von im -Schritt ist. Berechnen Sie dann den Maximierungsschritt, in dem Sie bezüglich und set
lo b s( θ , Y)ich( i + 1 )t hQ ( θ | θ( i )) = Eθ( i )[ l ( θ ; X| Y.]
θ( i )Θicht hQ ( θ | θ( i ))θθ( i + 1 )= m a x Q ( θ | θich) . Anschließend wiederholen Sie diese Schritte, bis die Methode zu einem Wert konvergiert, der Ihre Schätzung sein wird.
Wenn Sie weitere Informationen zu der Methode, ihren Eigenschaften, Beweisen oder Anwendungen benötigen, schauen Sie sich einfach den entsprechenden Wiki- Artikel an.
EM wird verwendet, weil es oft unmöglich oder unmöglich ist, die Parameter eines Modells direkt zu berechnen, um die Wahrscheinlichkeit eines Datensatzes bei diesem Modell zu maximieren.
quelle