Dies ist ein ziemlich einfaches Problem. Obwohl es einen Zusammenhang zwischen der Poisson- und der Negative Binomial-Verteilung gibt, halte ich dies für Ihre spezifische Frage für wenig hilfreich, da es die Leute dazu ermutigt, über negative Binomial-Prozesse nachzudenken. Grundsätzlich haben Sie eine Reihe von Poisson-Prozessen:
Y.ich(tich) |λich∼ Po i s s o n ( λichtich)
Wobei der Prozess ist und die Zeit, zu der Sie ihn beobachten, und die Individuen bezeichnet. Und Sie sagen, dass diese Prozesse "ähnlich" sind, indem Sie die Raten durch eine Verteilung miteinander verknüpfen:t i iY.ichtichich
λich∼ G a m m a ( α , β)
Wenn Sie die Integration / Mischung über , haben Sie:λich
Y.ich( tich) | α β∼ Ne gB i n ( α , pich)w h e r epich= tichtich+ β
Dies hat eine pmf von:
Pr ( Yich( tich) = yich| αβ) = Γ ( α + yich)Γ ( α ) yich!pyichich( 1 - pich)α
Um die Wartezeitverteilung zu erhalten, beachten wir Folgendes:
= 1 - ( 1 - p i ) α = 1 - ( 1 +
Pr ( Tich≤ tich| αβ) =1 - Pr (Tich> tich|α β) = 1 - Pr (Yich(tich) = 0 |α β)
= 1 - ( 1 - pich)α= 1 - ( 1 + tichβ)- α
Unterscheide dies und du hast das PDF:
pTich(tich| αβ) = αβ( 1 +tichβ)- ( α + 1 )
Dies ist ein Mitglied der generalisierten Pareto-Distributionen, Typ II. Ich würde dies als Wartezeitverteilung verwenden.
Um die Verbindung mit der Poisson-Verteilung zu sehen, beachten Sie, dass ist. Wenn Sie also einstellen, und nimm dann das Limit wir bekommen:αβ= E( λich| αβ)β= αλα → ∞
limα → ∞αβ( 1 + tichβ)- ( α + 1 )= limα → ∞λ ( 1 + λ tichα)- ( α + 1 )= λ exp( - λ tich)
Dies bedeutet, dass Sie als interpretieren können .1α
Eine Möglichkeit: Poisson ist zu exponentiell wie Negativ-Binomial zu ... exponentiell!
Es gibt einen reinsprungsteigernden Lévy-Prozess, der als negativer Binomialprozess bezeichnet wird, so dass der Wert zum Zeitpunkt eine negative Binomialverteilung aufweist. Im Gegensatz zum Poisson-Verfahren sind die Sprünge nicht mit ziemlicher Sicherheit . Stattdessen folgen sie einer logarithmischen Verteilung . Nach dem Gesetz der totalen Varianz ergibt sich ein Teil der Varianz aus der Anzahl der Sprünge (skaliert mit der durchschnittlichen Größe der Sprünge), und ein Teil der Varianz ergibt sich aus der Größe der Sprünge, und Sie können dies verwenden, um dies zu überprüfen ist überdispergiert.t 1
Es kann andere nützliche Beschreibungen geben. Siehe "Festlegung der negativen Binomialverteilung für die DNA-Sequenzierung".
Lassen Sie mich genauer erläutern, wie der oben beschriebene Negative Binomial Process aufgebaut werden kann.
Wählen Sie .p < 1
Sei IID mit logarithmischen Verteilungen, so dassX1, X2, X3, . . . P( xich= k ) = - 1Log( 1 - p )pkk.
Sei ein Poisson-Prozess mit konstanter Rate , so istN - log( 1 - p ) N( t ) = Pois ( - t log( 1 - p ) ) .
Lassen Sie der Prozess sein, damitNB P
Ich denke nicht, dass es aus dieser Beschreibung ersichtlich ist, dass eine negative binomiale -Verteilung hat, aber es gibt einen kurzen Beweis, der Wahrscheinlichkeitsfunktionen in Wikipedia verwendet , und Fisher hat dies auch bewiesen, als er das einführte logarithmische Verteilung zur Analyse der relativen Häufigkeit von Arten.N B ( t , p )NBP( t ) NB ( t , p )
quelle
Ich kann noch keinen Kommentar abgeben und entschuldige mich, dass dies keine endgültige Lösung ist.
Sie fragen nach der geeigneten Distribution, die mit einem NB verwendet werden soll, die jedoch nicht vollständig definiert ist. Wenn eine geeignete Verteilung zur Erklärung der Daten geeignet ist und Sie mit einem überdispersen Poisson beginnen, müssen Sie möglicherweise die Ursache der Überdispersion genauer untersuchen. Der NB unterscheidet nicht zwischen einem Poisson mit heterogenen Mitteln oder einer positiven Auftrittsabhängigkeit (das Eintreten eines Ereignisses erhöht die Wahrscheinlichkeit des Auftretens eines anderen Ereignisses). In der ununterbrochenen Zeit gibt es auch eine Zeitabhängigkeit, zB bedeutet eine positive Zeitabhängigkeit, dass der Zeitablauf die Wahrscheinlichkeit eines Auftretens erhöht. Es wurde auch gezeigt, dass eine negative Dauerabhängigkeit asymptotisch zu einem überdispersen Poisson führt [1] . Dies fügt der Liste das geeignete Wartezeitmodell hinzu.
quelle