Poisson ist zu exponentiell wie Gamma-Poisson zu was?

16

Eine Poisson-Verteilung kann Ereignisse pro Zeiteinheit messen, und der Parameter ist . Die Exponentialverteilung misst die Zeit bis zum nächsten Ereignis mit dem Parameter . Man kann eine Distribution in die andere konvertieren, je nachdem, ob es einfacher ist, Ereignisse oder Zeiten zu modellieren.1λ1λ

Nun ist ein Gamma-Poisson ein "gedehntes" Poisson mit einer größeren Varianz. Eine Weibull-Verteilung ist ein "gestrecktes" Exponential mit einer größeren Varianz. Aber können diese beiden einfach ineinander umgewandelt werden, genauso wie Poisson in Exponential umgewandelt werden kann?

Oder gibt es eine andere Verteilung, die in Kombination mit der Gamma-Poisson-Verteilung besser geeignet ist?

Das Gamma-Poisson ist auch als negative Binomialverteilung oder NBD bekannt.

Radfahrer
quelle

Antworten:

14

Dies ist ein ziemlich einfaches Problem. Obwohl es einen Zusammenhang zwischen der Poisson- und der Negative Binomial-Verteilung gibt, halte ich dies für Ihre spezifische Frage für wenig hilfreich, da es die Leute dazu ermutigt, über negative Binomial-Prozesse nachzudenken. Grundsätzlich haben Sie eine Reihe von Poisson-Prozessen:

Yi(ti)|λiPoisson(λiti)

Wobei der Prozess ist und die Zeit, zu der Sie ihn beobachten, und die Individuen bezeichnet. Und Sie sagen, dass diese Prozesse "ähnlich" sind, indem Sie die Raten durch eine Verteilung miteinander verknüpfen:t i iYitii

λiGamma(α,β)

Wenn Sie die Integration / Mischung über , haben Sie:λi

Yi(ti)|αβNegBin(α,pi)wherepi=titi+β

Dies hat eine pmf von:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

Um die Wartezeitverteilung zu erhalten, beachten wir Folgendes:

= 1 - ( 1 - p i ) α = 1 - ( 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

Unterscheide dies und du hast das PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

Dies ist ein Mitglied der generalisierten Pareto-Distributionen, Typ II. Ich würde dies als Wartezeitverteilung verwenden.

Um die Verbindung mit der Poisson-Verteilung zu sehen, beachten Sie, dass ist. Wenn Sie also einstellen, und nimm dann das Limit wir bekommen:αβ=E(λi|αβ)β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

Dies bedeutet, dass Sie als interpretieren können .1α

Wahrscheinlichkeitslogik
quelle
1
Sie können auch feststellen, dass die Wartezeitverteilung grob gesagt eine Exponentialverteilung mit einem Gamma-Zufallsratenparameter ist, und genau genommen ist dies eine Beta-Verteilung der zweiten Art, wie für jede Gamma-Verteilung mit einem Gamma-Zufallsratenparameter.
Stéphane Laurent
Auf der Grundlage von @probabilityislogic fand ich den folgenden Artikel, in dem die Beziehung zwischen NBD und Pareto näher erläutert wird: Gupta, Sunil und Donald G. Morrison. Schätzung von Heterogeneith in den Kaufpreisen der Verbraucher. Marketing Science, 1991, 10 (3), 264 & ndash; 269. Vielen Dank an alle, die mir geholfen haben, diese Frage zu beantworten.
zbicyclist
+1, ich denke, diese schöne analytische Form existiert möglicherweise nicht mehr für , wobei eine Konstante ist. Poisson(λiti+c)c
Randel
1
@randel - Sie könnten eine "nette" Form erhalten, indem Sie feststellen, dass dieses rv die Summe von zwei unabhängigen rvs ist ... wobei dasselbe wie oben ist und . Da nicht von oder ist das pdf von die Faltung des obigen negativen Binomial-pdf und eines Poisson-pdf. Um die Wartezeitverteilung zu erhalten, multiplizieren Sie einfach in der obigen Antwort mit . Sie erhalten dann Wartezeit cdf von und pdf vonY i X i ~ p o i s s o n ( c ) X i λ iZi=Yi+XiYiXipoisson(c)XiλiYiZiPr(Yi=0)Pr(Xi=0)=ec1ec(1+tiβ)αecαβ(1+tiβ)(α+1).
Wahrscheinlichkeitslogik
1
In Bezug auf die Mischungsverteilung funktioniert dies nicht, da Sie benötigen (sonst ist der Poisson-Mittelwert negativ). Die Gamma-Mischungsverteilung müsste abgeschnitten werden (ich habe in meiner vorherigen Antwort auch angenommen, dass ). Dies würde keine nb-Verteilung bedeuten. λi<cti1c>0
Wahrscheinlichkeitslogik
4

Eine Möglichkeit: Poisson ist zu exponentiell wie Negativ-Binomial zu ... exponentiell!

Es gibt einen reinsprungsteigernden Lévy-Prozess, der als negativer Binomialprozess bezeichnet wird, so dass der Wert zum Zeitpunkt eine negative Binomialverteilung aufweist. Im Gegensatz zum Poisson-Verfahren sind die Sprünge nicht mit ziemlicher Sicherheit . Stattdessen folgen sie einer logarithmischen Verteilung . Nach dem Gesetz der totalen Varianz ergibt sich ein Teil der Varianz aus der Anzahl der Sprünge (skaliert mit der durchschnittlichen Größe der Sprünge), und ein Teil der Varianz ergibt sich aus der Größe der Sprünge, und Sie können dies verwenden, um dies zu überprüfen ist überdispergiert.t1

Es kann andere nützliche Beschreibungen geben. Siehe "Festlegung der negativen Binomialverteilung für die DNA-Sequenzierung".


Lassen Sie mich genauer erläutern, wie der oben beschriebene Negative Binomial Process aufgebaut werden kann.

  • Wählen Sie .p<1

  • Sei IID mit logarithmischen Verteilungen, so dassX1,X2,X3,...P(xi=k)=1log(1p)pkk.

  • Sei ein Poisson-Prozess mit konstanter Rate , so istNlog(1p)N(t)=Pois(tlog(1p)).

  • Lassen Sie der Prozess sein, damitNBP

NBP(t)=i=1N(t)Xi.

NBP ist ein reiner Sprungprozess mit logarithmisch verteilten Sprüngen. Die Lücken zwischen den Sprüngen folgen einer Exponentialverteilung mit ratelog(1p).

Ich denke nicht, dass es aus dieser Beschreibung ersichtlich ist, dass eine negative binomiale -Verteilung hat, aber es gibt einen kurzen Beweis, der Wahrscheinlichkeitsfunktionen in Wikipedia verwendet , und Fisher hat dies auch bewiesen, als er das einführte logarithmische Verteilung zur Analyse der relativen Häufigkeit von Arten.N B ( t , p )NBP(t)NB(t,p)

Douglas Zare
quelle
1
Nein, ein zusammengesetzter Poisson-Prozess hat eine exponentielle Wartezeit. Dies bedeutet, dass Sie IID-Zufallsvariablen mit einer gewissen Verteilung hinzufügen . Pois(λt)
Douglas Zare
Nein, das ist nicht mit einem zusammengesetzten Poisson-Prozess gemeint. en.wikipedia.org/wiki/Compound_Poisson_process "Die Sprünge kommen zufällig nach einem Poisson-Verfahren an und die Größe der Sprünge ist ebenfalls zufällig mit einer festgelegten Wahrscheinlichkeitsverteilung." Ich habe nicht gesagt, IID Poisson-Variablen. Sie nehmen die te Teilsumme logarithmischer IID-Zufallsvariablen, wobei der Wert eines Poisson-Prozesses ist. NNN
Douglas Zare
Wenn Sie einen Poisson-Prozess mit multiplizieren , ist dies kein Poisson-Prozess und die Wartezeiten bleiben exponentiell. 2
Douglas Zare
Lassen Sie uns diese Diskussion im Chat fortsetzen
Douglas Zare
0

Ich kann noch keinen Kommentar abgeben und entschuldige mich, dass dies keine endgültige Lösung ist.

Sie fragen nach der geeigneten Distribution, die mit einem NB verwendet werden soll, die jedoch nicht vollständig definiert ist. Wenn eine geeignete Verteilung zur Erklärung der Daten geeignet ist und Sie mit einem überdispersen Poisson beginnen, müssen Sie möglicherweise die Ursache der Überdispersion genauer untersuchen. Der NB unterscheidet nicht zwischen einem Poisson mit heterogenen Mitteln oder einer positiven Auftrittsabhängigkeit (das Eintreten eines Ereignisses erhöht die Wahrscheinlichkeit des Auftretens eines anderen Ereignisses). In der ununterbrochenen Zeit gibt es auch eine Zeitabhängigkeit, zB bedeutet eine positive Zeitabhängigkeit, dass der Zeitablauf die Wahrscheinlichkeit eines Auftretens erhöht. Es wurde auch gezeigt, dass eine negative Dauerabhängigkeit asymptotisch zu einem überdispersen Poisson führt [1] . Dies fügt der Liste das geeignete Wartezeitmodell hinzu.

Bradsher der Wiesenlerche
quelle
1
Ursache der Überdispersion: Hierbei handelt es sich um Kaufdaten des Verbrauchers. Einzelverbraucher sind Giftverbraucher mit jeweils einer Kaufrate von Lambda. Aber nicht jeder Verbraucher hat das gleiche Lambda - das ist die Ursache für die Überdispersion. Die Lambda-Kaufraten gelten als Gamma-Verteilung. Dies ist ein weit verbreitetes Modell (geht auf ASC Ehrenberg zurück), aber ich habe in seinem Schreiben nichts gefunden, was diese Frage beantwortet.
zbicyclist