Wie repräsentativ ist die Poisson-Verteilung der Verteilung von Ereignissen in der Realität?

8

Ich habe mich immer gefragt, wie gut die Poisson-Verteilung zu den Ereignissen passt, die wir in der Realität beobachten. Fast immer habe ich gesehen, dass es zur Modellierung des Auftretens von Ereignissen verwendet wird. (Zum Beispiel die Ankunft von Autos in einem Parkhaus oder die Anzahl oder Nachrichten, die von Computerhosts in einem Netzwerk usw. gesendet / empfangen werden.)

Wir modellieren solche Ereignisse normalerweise nach der Poisson-Verteilung. Ist die Verteilung nur eine gute erste Annäherung an die Realität? Wenn ich die Anzahl der Autos / Tag oder Nachrichten / Tag in den beiden obigen Beispielen beobachte und diejenigen, die durch Auswahl aus der Verteilung ausgegeben werden, wie stark unterscheiden sie sich? Wie gut ist Poisson? (Ist es eine Annäherung?) Was ist die "Magie" hinter Poisson, dass es nur richtig macht (intuitiv gesprochen :)?

PhD
quelle
4
Es gibt einige gute Ausgangspunkte, wenn Sie die Ableitung der Poisson-Verteilung googeln, die zeigen, wie Poisson auf magische Weise von der Binomialverteilung abgeleitet wird, bei der n groß und die Wahrscheinlichkeit eines Ereignisses gering ist. Von dort aus macht es Sinn, damit Zählereignisse zu modellieren. Die Frage, die ich denke, ist, wie gut reale Zählereignisse zu dieser reibungslosen Erweiterung der Binomialsituation passen.
Peter Ellis

Antworten:

5

Ein Beispiel, für das ich sprechen kann, ist der Supermarktverkauf von Konsumgütern (CPG). Dies sind auch Zählereignisse - der Supermarkt verkauft möglicherweise 0 Einheiten pro Tag oder 1 oder 2 usw., sodass die Poisson-Verteilung wie eine gute erste Lösung erscheint.

Die zugrunde liegende Binomialverteilung @PeterEllis-Notizen gilt jedoch nicht. Ja, wir können möglicherweise die Anzahl der Kunden mit einem Binomial modellieren ... aber einige Kunden kaufen 1 Einheit, einige kaufen 2 Einheiten und einige laden ihre Vorratskammern und kaufen 10 Einheiten.

Das Ergebnis ist normalerweise überdispers, so dass eine negative Binomialverteilung viel besser passt als eine Poisson-Verteilung. (Gelegentlich kann es sogar zu einer Unterdispersion bei sich sehr schnell bewegenden Gegenständen wie Milch kommen.)

Stephan Kolassa
quelle
3
+1. Ich dachte nur, es wäre erwähnenswert, dass das Poisson ein Sonderfall des negativen Binomials ist und dass eine Möglichkeit, das negative Binomial abzuleiten, darin besteht, viele verschiedene Poisson-Verteilungen mit unterschiedlichen Mitteln zu mischen.
David J. Harris
4

Wenn die gezählten Dinge unabhängig voneinander sind und die Rate konstant ist (oder einem Modell wie bei der Poisson-Regression folgt), ist die Poisson-Verteilung im Allgemeinen recht gut. Beispiele wie Autos, die in einer Garage ankommen, funktionieren in der Regel recht gut (über Zeiträume, in denen die Rate ziemlich konstant ist, einschließlich der Hauptverkehrszeit und mitten in der Nacht, würde eine Garage, die von 9 bis 5 Arbeitern frequentiert wird, nicht gut funktionieren). Wann Sie in der Garage ankommen, hat wenig Einfluss darauf, wann ich ankomme. Es gibt jedoch Ausnahmen dahingehend, dass zwei Personen, die sich zu einem bestimmten Zeitpunkt treffen, wahrscheinlich näher beieinander ankommen. Wenn eine Person der anderen folgt, sind sie sich noch näher. Auch Dinge wie eine nahe gelegene Ampel könnten Klumpen bei den Ankünften verursachen, die nicht mit einem Poisson übereinstimmen würden.

Wenn Sie einen bestimmten Datensatz vergleichen möchten, um festzustellen, ob der Poisson gut zu Ihnen passt, können Sie ein hängendes Rootogramm verwenden .

Greg Snow
quelle
1
+ für das hängende Rootogramm!
Mike Dunlavey
2

α>0β=ln(α)α

Eine andere Möglichkeit, die Dispersion zu erhöhen, ist die Nullinflation, die entweder auf Poisson oder negatives Binom angewendet werden kann. Um dies zu nutzen, führen Sie zu jeder Messzeit zunächst einen Bernoulli-Versuch durch (werfen Sie eine Münze). Wenn die Münze "Köpfe" ist, ist die Messung 0. Andernfalls wird die Messung aus der Poisson- oder negativen Binomialverteilung gezogen.

Mike Dunlavey
quelle
2

Ich habe gesehen, dass das Poisson-Modell die Varianz überschätzt (logisch und offensichtlich), wenn sich herausstellt, dass die Ereignisse regelmäßig sind, während das Poisson-Modell die Varianz unterschätzt, wenn sich herausstellt, dass die Ereignisse gruppiert sind. Die Poisson-Verteilung wird aus einem zufälligen Poisson-Punkt-Prozess erzeugt.

tP.(0,t)=e- -einteintP.(1,t),P.(2,t),usw. Die allgemeine Poisson-Formel wird durch Inspektion abgeleitet. C. Chatfield Statistics for Technology: Ein Kurs in angewandter Statistik , 2. Aufl. 1978, Pub. Chapman and Hall: siehe Seiten 70-75.

Diese beiden Beispiele verletzen die zugrunde liegende Zufallsanforderung. Wenn die Ereignisse mehr oder weniger zufällig sind, ist das Poisson-Modell ein faires Modell. Autos, die auf einem belebten Parkplatz in der Innenstadt ankommen, können ein Beispiel für einen Cluster-Datensatz sein, vielleicht aufgrund von 9 bis 5 Benutzern?

Peter Bennett
quelle