Ich versuche, die Wahrscheinlichkeitsverteilung einer Summe einer zufälligen Anzahl von Variablen zu finden, die nicht identisch verteilt sind. Hier ist ein Beispiel:
John arbeitet in einem Kundendienst-Callcenter. Er erhält Anrufe mit Problemen und versucht diese zu lösen. Diejenigen, die er nicht lösen kann, leitet er an seinen Vorgesetzten weiter. Nehmen wir an, dass die Anzahl der Anrufe, die er an einem Tag erhält, einer Poisson-Verteilung mit dem Mittelwert folgt . Die Schwierigkeit jedes Problems variiert von ziemlich einfachen Dingen (mit denen er sich definitiv befassen kann) bis zu sehr speziellen Fragen, die er nicht lösen kann. Angenommen, die Wahrscheinlichkeit er das i- te Problem lösen kann, folgt einer Beta-Verteilung mit den Parametern und und ist unabhängig von den vorherigen Problemen. Wie verteilt sich die Anzahl der Anrufe, die er an einem Tag löst?
Formal habe ich:
für
wobei , und
Beachten Sie, dass ich vorerst gerne davon ausgehen kann, dass die unabhängig sind. Ich würde auch akzeptieren, dass sich die Parameter und nicht gegenseitig beeinflussen, obwohl in einem realen Beispiel, wenn groß ist, die Parameter und sind, dass die Beta-Verteilung hat mehr Masse bei niedrigen Erfolgsraten . Aber lassen Sie uns das jetzt ignorieren.
Ich kann berechnen aber das war es auch schon. Ich kann auch Werte simulieren, um eine Vorstellung davon zu bekommen, wie die Verteilung von aussieht (es sieht aus wie Poisson, aber ich weiß nicht, ob das an den Zahlen von und ich versucht habe, oder ob es verallgemeinert, und wie es sich für verschiedene Parameterwerte ändern könnte). Irgendeine Idee, was diese Verteilung ist oder wie ich sie ableiten könnte?
Bitte beachten Sie, dass ich diese Frage auch im TalkStats-Forum gepostet habe, aber ich dachte, dass sie hier möglicherweise mehr Aufmerksamkeit erhält. Entschuldigung für das Cross-Posting und vielen Dank im Voraus für Ihre Zeit.
EDIT : Wie sich herausstellt (siehe die sehr hilfreichen Antworten unten - und danke dafür!), Ist es tatsächlich eine -Distribution, etwas was ich aufgrund meiner Intuition und einiger Simulationen vermutete, aber nicht beweisen konnte. Was mich jetzt jedoch überrascht, ist, dass die Poisson-Verteilung nur vom Mittelwert der -Verteilung abhängt, aber nicht von ihrer Varianz beeinflusst wird.
Beispielsweise haben die folgenden zwei Beta-Verteilungen den gleichen Mittelwert, aber unterschiedliche Varianz. Der Klarheit halber repräsentiert das blaue PDF ein und das rote .
Beide würden jedoch zu derselben -Verteilung führen, die mir etwas kontraintuitiv erscheint. (Nicht zu sagen, dass das Ergebnis falsch ist, nur überraschend!)
quelle
Antworten:
Die Aufrufe ( das ) kommen gemäß einem Poisson-Prozess an. Die Gesamtzahl der Anrufe folgt einer Poisson-Verteilung. Teilen Sie die Anrufe in zwei Typen ein, z. B. ob oder . Das Ziel ist es, den Prozess zu bestimmen, der die s erzeugt. Dies ist trivial, wenn mit einer festen Wahrscheinlichkeit : Nach dem Überlagerungsprinzip von Poisson-Prozessen wäre der auf nur s verdünnte vollständige Prozess auch ein Poisson-Prozess mit der Rate . In der Tat ist dies der Fall, wir benötigen nur einen zusätzlichen Schritt, um dorthin zu gelangen.Xi N Xi=1 Xi=0 1 Xi=1 p 1 pμ
Marginalisieren Sie über , so dasspi
Wobei die Beta-Funktion ist. Unter Verwendung der Tatsache, dass , vereinfacht sich das Obige zu;B(a,b)=Γ(a)Γ(b)Γ(a+b) Γ(x+1)=xΓ(x)
Ein numerisches Beispiel (mit R) ... in der Abbildung stammen die vertikalen Linien aus der Simulation und die roten Punkte sind die oben abgeleiteten pmf:
quelle
Da eine Zufallsvariable mit einem , haben Sie und dies ist tatsächlich die Wahrscheinlichkeit dass John tatsächlich das te Problem löst , unabhängig von allen anderen.pi Beta(α,β) E[pi]=αα+β i
Da die Gesamtzahl der Probleme an einem Tag eine Poisson-Verteilung mit dem Parameter und jedes mit der Wahrscheinlichkeit gelöst wird , hat die Anzahl, die John jeden Tag löst, eine Poisson-Verteilung mit dem Parameterμ αα+β μαα+β
Ihre Berechnung der Wahrscheinlichkeit, dass er keine Probleme löst, sollteP(Y=0)=e−μα/(α+β)
quelle