Wie ist die Wahrscheinlichkeitsverteilung dieser zufälligen Summe nicht-iider Bernoulli-Variablen?

9

Ich versuche, die Wahrscheinlichkeitsverteilung einer Summe einer zufälligen Anzahl von Variablen zu finden, die nicht identisch verteilt sind. Hier ist ein Beispiel:

John arbeitet in einem Kundendienst-Callcenter. Er erhält Anrufe mit Problemen und versucht diese zu lösen. Diejenigen, die er nicht lösen kann, leitet er an seinen Vorgesetzten weiter. Nehmen wir an, dass die Anzahl der Anrufe, die er an einem Tag erhält, einer Poisson-Verteilung mit dem Mittelwert folgt . Die Schwierigkeit jedes Problems variiert von ziemlich einfachen Dingen (mit denen er sich definitiv befassen kann) bis zu sehr speziellen Fragen, die er nicht lösen kann. Angenommen, die Wahrscheinlichkeit er das i- te Problem lösen kann, folgt einer Beta-Verteilung mit den Parametern und und ist unabhängig von den vorherigen Problemen. Wie verteilt sich die Anzahl der Anrufe, die er an einem Tag löst?μpiαβ

Formal habe ich:

Y=I(N>0)i=0NXi füri=0,1,2,...,N

wobei , undNPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

Beachten Sie, dass ich vorerst gerne davon ausgehen kann, dass die unabhängig sind. Ich würde auch akzeptieren, dass sich die Parameter und nicht gegenseitig beeinflussen, obwohl in einem realen Beispiel, wenn groß ist, die Parameter und sind, dass die Beta-Verteilung hat mehr Masse bei niedrigen Erfolgsraten . Aber lassen Sie uns das jetzt ignorieren.Xiμ,αβμαβp

Ich kann berechnen aber das war es auch schon. Ich kann auch Werte simulieren, um eine Vorstellung davon zu bekommen, wie die Verteilung von aussieht (es sieht aus wie Poisson, aber ich weiß nicht, ob das an den Zahlen von und ich versucht habe, oder ob es verallgemeinert, und wie es sich für verschiedene Parameterwerte ändern könnte). Irgendeine Idee, was diese Verteilung ist oder wie ich sie ableiten könnte?P(Y=0)Yμ,αβ

Bitte beachten Sie, dass ich diese Frage auch im TalkStats-Forum gepostet habe, aber ich dachte, dass sie hier möglicherweise mehr Aufmerksamkeit erhält. Entschuldigung für das Cross-Posting und vielen Dank im Voraus für Ihre Zeit.

EDIT : Wie sich herausstellt (siehe die sehr hilfreichen Antworten unten - und danke dafür!), Ist es tatsächlich eine -Distribution, etwas was ich aufgrund meiner Intuition und einiger Simulationen vermutete, aber nicht beweisen konnte. Was mich jetzt jedoch überrascht, ist, dass die Poisson-Verteilung nur vom Mittelwert der -Verteilung abhängt, aber nicht von ihrer Varianz beeinflusst wird.Poisson(μαα+β)Beta

Beispielsweise haben die folgenden zwei Beta-Verteilungen den gleichen Mittelwert, aber unterschiedliche Varianz. Der Klarheit halber repräsentiert das blaue PDF ein und das rote .Beta(2,2)Beta(0.75,0.75)

Beta-Distributionen

Beide würden jedoch zu derselben -Verteilung führen, die mir etwas kontraintuitiv erscheint. (Nicht zu sagen, dass das Ergebnis falsch ist, nur überraschend!)Poisson(0.5μ)

Constantinos
quelle
Für festes gibt es eine Poisson-Binomialverteilung, aber Ihr Problem ist komplizierter als dieses. N
Tim
Danke, ich kenne die Poisson-Binomialverteilung, aber ist hier zufällig. N
Constantinos
Sie könnten einen Blick auf die Verbindung Poisson werfen , aber Sie müssen möglicherweise einige Arbeiten mit den Nullen machen, um dies nützlich zu machen
Glen_b

Antworten:

6

Die Aufrufe ( das ) kommen gemäß einem Poisson-Prozess an. Die Gesamtzahl der Anrufe folgt einer Poisson-Verteilung. Teilen Sie die Anrufe in zwei Typen ein, z. B. ob oder . Das Ziel ist es, den Prozess zu bestimmen, der die s erzeugt. Dies ist trivial, wenn mit einer festen Wahrscheinlichkeit : Nach dem Überlagerungsprinzip von Poisson-Prozessen wäre der auf nur s verdünnte vollständige Prozess auch ein Poisson-Prozess mit der Rate . In der Tat ist dies der Fall, wir benötigen nur einen zusätzlichen Schritt, um dorthin zu gelangen.XiNXi=1Xi=01Xi=1p1pμ

Marginalisieren Sie über , so dass pi

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

Wobei die Beta-Funktion ist. Unter Verwendung der Tatsache, dass , vereinfacht sich das Obige zu;B(a,b)=Γ(a)Γ(b)Γ(a+b)Γ(x+1)=xΓ(x)

Pr(Xi=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
Mit anderen Worten, . Durch die Überlagerungseigenschaft ist Poisson, verteilt mit der Rate .XiBernoulli(αα+β)Yαμα+β

Ein numerisches Beispiel (mit R) ... in der Abbildung stammen die vertikalen Linien aus der Simulation und die roten Punkte sind die oben abgeleiteten pmf:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

Geben Sie hier die Bildbeschreibung ein

Nate Papst
quelle
3
  1. Da eine Zufallsvariable mit einem , haben Sie und dies ist tatsächlich die Wahrscheinlichkeit dass John tatsächlich das te Problem löst , unabhängig von allen anderen.piBeta(α,β)E[pi]=αα+βi

  2. Da die Gesamtzahl der Probleme an einem Tag eine Poisson-Verteilung mit dem Parameter und jedes mit der Wahrscheinlichkeit gelöst wird , hat die Anzahl, die John jeden Tag löst, eine Poisson-Verteilung mit dem Parameterμαα+βμαα+β

  3. Ihre Berechnung der Wahrscheinlichkeit, dass er keine Probleme löst, sollteP(Y=0)=eμα/(α+β)

Henry
quelle