Ich habe fast die gleichen Fragen wie diese: Wie kann ich die Summe der Bernoulli-Zufallsvariablen effizient modellieren?
Aber die Einstellung ist ganz anders:
, , ~ 20, ~ 0,1
Wir haben die Daten für die Ergebnisse von Bernoulli-Zufallsvariablen: ,
Wenn wir mit maximaler Wahrscheinlichkeitsschätzung schätzen (und ), stellt sich heraus, dass dann viel größer ist erwartet durch die anderen Kriterien:pP { S = 3 } ( p M L E i ) P { S = 3 } ( p M L E i ) - P e x p e c t e d { S = 3 } ≤ 0,05
Also, und kann nicht als unabhängig behandelt werden (sie haben eine geringe Abhängigkeit).
Es gibt einige Einschränkungen wie diese: und (bekannt), die bei der Schätzung von helfen sollten .
Wie könnten wir in diesem Fall versuchen, die Summe der Bernoulli-Zufallsvariablen zu modellieren?
Welche Literatur könnte nützlich sein, um die Aufgabe zu lösen?
AKTUALISIERT
Es gibt einige weitere Ideen:
(1) Es ist anzunehmen, dass die unbekannte Abhängigkeit zwischen nach einem oder mehreren Erfolgen in Serie beginnt. Wenn also , und . ∑ i = 1 , K X i >0 p K + 1 → p ' K + 1 p ' K + 1 < p K + 1
(2) Um MLE verwenden zu können, benötigen wir das am wenigsten fragwürdige Modell. Hier ist eine Variante:
∑ i = 1 , k X i = 0 P { X 1 , . . . , X k , X k + 1 , . . . , X N. wenn für jedes k if und und für jedes k.∑ i = 1 , k - 1 X i = 0 X k = 1 P ' { X k + 1 = 1 , X k + 2 = 1 ,
(3) Da wir nur an interessiert sind, können wir (die Wahrscheinlichkeit von Erfolgen für N- (k + 1) + 1 Summanden vom Schwanz). Und benutze die ParametrisierungP ' { X k + 1 , . . . , X N } ≤ P ' ' { ≤ i = 1 , k X i = s ' ; N - ( ∑ i = k + 1 , N X i P " { ∑ i = k , N X i = s
(4) Verwenden Sie MLE für ein Modell, das auf den Parametern und basiert mit für (und ein beliebiges ) und einige andere native Einschränkungen .p 0 , 1 , p 1 , 1 ; p 0 , 2 , p 1 , 2 , p 2 , 2 ; . . . p s ' , l = 0 s ' ≥ 6 l
Ist mit diesem Plan alles in Ordnung?
AKTUALISIERT 2
Einige Beispiele für die empirische Verteilung (rot) im Vergleich zur Poisson-Verteilung (blau) (die Poisson-Mittelwerte sind 2,22 und 2,45, die Stichprobengrößen sind 332 und 259):
Für Proben (A1, A2) mit dem Poisson bedeutet 2,28 und 2,51 (Probengrößen sind 303 und 249):
Für verbundene Proben A1 + A2 (die Stichprobengröße beträgt 552):
Es sieht so aus, als ob eine Korrektur von Poisson das beste Modell sein sollte :).
Antworten:
Ein Ansatz wäre, die mit einem verallgemeinerten linearen Modell (GLM) zu modellieren. Hier würden Sie , die Erfolgswahrscheinlichkeit des -ten Versuchs, als (logistisch lineare) Funktion der jüngsten Beobachtungsgeschichte formulieren . Sie passen also im Wesentlichen ein autoregressives GLM an, bei dem das Rauschen Bernoulli und die Verbindungsfunktion logit ist. Das Setup ist:p i iX pi i
Die Parameter des Modells sind , die durch logistische Regression geschätzt werden können. (Alles, was Sie tun müssen, ist, Ihre Entwurfsmatrix unter Verwendung des relevanten Teils des Beobachtungsverlaufs bei jedem Versuch einzurichten und diese an eine logistische Regressionsschätzfunktion zu übergeben. Die Log-Wahrscheinlichkeit ist konkav, sodass es ein eindeutiges globales Maximum für die Parameter gibt.) Wenn die Ergebnisse tatsächlich unabhängig sind, werden die auf Null gesetzt; Positive bedeuten, dass nachfolgende zunehmen, wenn ein Erfolg beobachtet wird.a i a i p i{b,a1,…ak} ai ai pi
Das Modell liefert keinen einfachen Ausdruck für die Wahrscheinlichkeit über die Summe der , aber dies ist einfach durch Simulation (Partikelfilterung oder MCMC) zu berechnen, da das Modell eine einfache Markovsche Struktur aufweist.Xi
Diese Art von Modell wurde mit großem Erfolg verwendet, um zeitliche Abhängigkeiten zwischen "Spitzen" von Neuronen im Gehirn zu modellieren, und es gibt eine umfangreiche Literatur zu autoregressiven Punktprozessmodellen. Siehe z. B. Truccolo et al. 2005 (obwohl in diesem Artikel ein Poisson anstelle einer Bernoulli-Wahrscheinlichkeit verwendet wird, ist die Zuordnung von einem zum anderen unkompliziert).
quelle
Wenn die Abhängigkeit auf Verklumpungen zurückzuführen ist, könnte ein zusammengesetztes Poisson-Modell die Lösung als Modell von . Eine etwas zufällige Referenz ist diese von Barbour und Chryssaphinou.Sj
In eine völlig andere Richtung, da Sie angeben, dass 20 und damit relativ klein ist, könnte es sein, ein grafisches Modell der zu erstellen , aber ich weiß nicht, ob Ihr Setup und Ihre Daten dies ermöglichen. Wie @chl kommentiert, ist es hilfreich, wenn Sie beschreiben, was die sind.X i j X i , jN Xij Xi,j
Wenn die sequentielle Messungen darstellen, z. B. über die Zeit, und die Abhängigkeit damit zusammenhängt, besteht eine dritte Möglichkeit - und in gewissem Umfang ein Kompromiss zwischen den beiden obigen Vorschlägen - darin, ein verstecktes Markov-Modell von zu verwenden die . X i , jXi,j Xi,j
quelle