Das auf Null aufgeblasene Poisson-Regressionsmodell wird für eine Stichprobe durch und es wird ferner angenommen, dass die Parameter und erfüllt sindY i = { 0 mit der Wahrscheinlichkeit p i + ( 1 - p i ) e - λ i k mit der Wahrscheinlichkeit ( 1 - p i ) e - λ i λ k i / k ! λ = ( λ 1 , … , λ n ) p =
Die entsprechende logarithmische Wahrscheinlichkeit des Poisson-Regressionsmodells mit Null- ist
Hier sind und die Entwurfsmatrizen. Diese Matrizen können abhängig von den Merkmalen, die für die beiden Erzeugungsprozesse verwendet werden sollen, gleich sein. Sie haben jedoch die gleiche Anzahl von Zeilen.
Unter der Annahme, dass wir beobachten wenn aus dem perfekten stammt, und wenn aus dem Poisson-Zustand stammt, wäre die logarithmische Wahrscheinlichkeit
Aber sind latente Variablen nicht nicht beobachtbar? Der Zweck besteht darin, die erste Log-Wahrscheinlichkeit zu maximieren. Wir müssen jedoch latente Variablen einführen und eine neue Log-Wahrscheinlichkeit ableiten. Mit dem EM-Algorithmus können wir dann die zweite Log-Wahrscheinlichkeit maximieren. Dies setzt jedoch voraus, dass wir wissen, dass entweder oder ?
quelle
Antworten:
Die Wurzel der Schwierigkeit, die Sie haben, liegt im Satz:
Wie Sie beobachtet haben, können Sie nicht. Stattdessen maximieren Sie den erwarteten Wert der zweiten Protokollwahrscheinlichkeit (bekannt als "vollständige Datenprotokollwahrscheinlichkeit"), wobei der erwartete Wert über .zi
Dies führt zu einer iterativen Prozedur, bei der Sie bei der -Iteration die erwarteten Werte des Berücksichtigung der Parameterschätzungen aus der -Iteration berechnen (dies wird als "E-Schritt" bezeichnet) ",) Ersetzen Sie sie dann durch die vollständige Datenprotokollwahrscheinlichkeit (siehe EDIT unten, warum wir dies in diesem Fall tun können) und maximieren Sie diese in Bezug auf die Parameter, um die Schätzungen für die aktuelle Iteration zu erhalten (der" M-Schritt "). .)kth zi (k−1)th
Die Wahrscheinlichkeit eines vollständigen Datenprotokolls für das Poisson ohne Inflation im einfachsten Fall - zwei Parameter, z. B. und - ermöglicht eine erhebliche Vereinfachung des M-Schritts, was sich in gewissem Maße auf Ihre Form überträgt. Ich werde Ihnen anhand eines R-Codes zeigen, wie das im einfachen Fall funktioniert, damit Sie das Wesentliche sehen können. Ich werde nicht so viel wie möglich vereinfachen, da dies zu einem Verlust an Klarheit führen kann, wenn Sie an Ihr Problem denken:λ p
In Ihrem Fall führen Sie bei jedem Schritt eine gewichtete Poisson-Regression durch, bei der die Gewichteβ λi
1-zhat
die Schätzungen von und damit und dann maximieren:in Bezug auf den Koeffizientenvektor Ihrer Matrix , um die Schätzungen von . Die erwarteten Werte werden bei jeder Iteration erneut berechnet.p i E z i = p i / ( p i + ( 1 - p i ) exp ( - λ i ) )G pi Ezi=pi/(pi+(1−pi)exp(−λi))
Wenn Sie dies für reale Daten tun möchten, anstatt nur den Algorithmus zu verstehen, sind bereits R-Pakete vorhanden. Hier ist ein Beispiel http://www.ats.ucla.edu/stat/r/dae/zipoisson.htm , das die
pscl
Bibliothek verwendet.BEARBEITEN: Ich sollte betonen, dass wir den erwarteten Wert der Wahrscheinlichkeit des vollständigen Datenprotokolls maximieren und NICHT die Wahrscheinlichkeit des vollständigen Datenprotokolls mit den erwarteten Werten der fehlenden Daten / latenten Variablen, die eingesteckt sind, maximieren Die Wahrscheinlichkeit eines vollständigen Datenprotokolls ist in den fehlenden Daten linear, da hier die beiden Ansätze gleich sind, ansonsten jedoch nicht.
quelle