Ich suche einige gute Beispiele für Situationen, die für das Modellieren mit einer Poisson-Verteilung ungeeignet sind, um den Schülern die Erklärung der Poisson-Verteilung zu erleichtern.
Üblicherweise wird die Anzahl der Kunden, die in einem Zeitintervall in einem Geschäft eintreffen, als Beispiel verwendet, das durch eine Poisson-Verteilung modelliert werden kann. Ich suche ein Gegenbeispiel in ähnlicher Weise, dh eine Situation, die als positiver Zählvorgang in kontinuierlicher Zeit angesehen werden kann, die eindeutig nicht Poisson ist.
Die Situation sollte idealerweise so einfach und unkompliziert wie möglich sein, um es den Schülern zu erleichtern, sie zu erfassen und sich zu erinnern.
Antworten:
Anzahl der Zigaretten, die in einem bestimmten Zeitraum geraucht wurden: Dies erfordert einen Prozess ohne Luftdruck (z. B. Poisson ohne Luftdruck oder negatives Binomial ohne Luftdruck), da nicht jeder Zigaretten raucht.
quelle
Meinen Sie damit positive Zähldaten? Grenzenlos?
Das negative Binomial ist beliebt.
Ein weiteres gutes Modell ist das Poisson mit aufgeblähter 0. Dieses Modell geht davon aus, dass entweder etwas passiert oder nicht - und wenn ja, folgt es einem Poisson. Ich habe kürzlich ein Beispiel gesehen. Krankenschwestern, die AIDS-Patienten behandelten, wurden gefragt, wie oft sie aufgrund ihrer Beteiligung an AIDS-Patienten stigmatisierende Verhaltensweisen von anderen erfahren haben. Eine große Anzahl hatte noch nie solche Erfahrungen gemacht, möglicherweise weil sie dort gearbeitet oder gelebt hatten. Von denen, die dies taten, war die Anzahl der stigmatisierenden Erlebnisse unterschiedlich. Es wurden mehr Nullen gemeldet, als Sie von einem reinen Poisson erwarten würden, im Grunde genommen, weil sich ein bestimmter Teil der untersuchten Gruppe nicht in einer Umgebung befand, in der sie solchen Verhaltensweisen ausgesetzt waren.
Eine Mischung aus Poisson würde Ihnen auch einen Punktprozess geben.
quelle
Zählen von Prozessen, die nicht Poisson sind? Nun, jeder endliche Probenraumprozess wie binomial oder diskret uniform. Sie erhalten einen Poisson-Zählprozess, wenn Sie Ereignisse mit unabhängigen Interarrival-Zeiten zählen, die exponentiell verteilt sind, sodass eine ganze Reihe von Verallgemeinerungen davon abweichen, z Verteilung.
quelle
Es ist unklar, ob Sie Prozesse zählen möchten oder nicht.
Wenn ich das "Teaching" -Tag so interpretiere, dass Sie den Poisson-Prozess unterrichten, ist der Bernoulli-Prozess für das Unterrichten eines Prozesses im Allgemeinen ein einfacher, zufälliger Prozess, der zu erklären und zu visualisieren ist und mit dem Poisson-Prozess zusammenhängt. Der Bernoulli-Prozess ist das diskrete Analogon, daher könnte er ein hilfreiches Begleitkonzept sein. Es ist nur so, dass wir anstelle von kontinuierlicher Zeit diskrete Zeitintervalle haben.
Ein Beispiel könnte ein Verkäufer von Tür zu Tür sein, bei dem wir die Erfolge von Haushalten zählen, die einen Kauf tätigen.
B (n, p) anstelle eines Poisson
Das ist der Ansatz, den Bertsekas und Tsitsiklis in Introduction To Probability , 2nd ed., Verwenden , um den Bernoulli-Prozess vor dem Poisson-Prozess einzuführen. In ihrem Lehrbuch finden sich weitere Erweiterungen des Bernoulli-Prozesses, die auf den Poisson-Prozess anwendbar sind, z. B. das Zusammenführen oder Partitionieren dieser Prozesse sowie Probleme mit Lösungsansätzen.
Wenn Sie nach Beispielen für zufällige Prozesse suchen und nur die Namen herauswerfen möchten, gibt es einige.
Der Gauß-Prozess ist in Anwendungen von Bedeutung. Insbesondere der Weiner-Prozess, der eine Art Gauß-Prozess ist, wird auch als Brownsche Standardbewegung bezeichnet und findet Anwendung in den Bereichen Finanzen und Physik.
quelle
Als Versicherungsmathematiker für Sach- und Unfallversicherungen beschäftige ich mich ständig mit Beispielen aus der Praxis diskreter Prozesse, die nicht von Poisson stammen. Für Geschäftsbereiche mit hohem Schweregrad und niedriger Frequenz ist die Poisson-Verteilung ungeeignet, da sie ein Varianz-Mittelwert-Verhältnis von 1 erfordert. Die oben erwähnte negative Binomialverteilung wird viel häufiger verwendet, und die Delaporte-Verteilungen wird in einigen Literaturstellen verwendet, in der nordamerikanischen versicherungsmathematischen Standardpraxis jedoch seltener.
Warum das so ist, ist eine tiefere Frage. Ist das negative Binom so viel besser, weil es einen Poisson-Prozess darstellt, bei dem der mittlere Parameter selbst gammaverteilt ist? Oder liegt es daran, dass Schadensereignisse nicht unabhängig sind (wie es nach derzeitigem Kenntnisstand bei Erdbeben der Fall ist: Je länger auf das Rutschen der Erde gewartet wird, desto wahrscheinlicher ist es, dass sich Druck aufbaut), desto instationärer ist es (die Intervalle) können nicht in Sequenzen unterteilt werden, von denen jede stationär ist, was die Verwendung eines inhomogenen Poisson ermöglichen würde. Einige Geschäftsbereiche erlauben mit Sicherheit das gleichzeitige Auftreten (z. B. Behandlungsfehler mit mehreren Ärzten, die von der Police abgedeckt sind).
quelle
Andere haben einige Beispiele von Punktprozessen erwähnt, die nicht Poisson sind. Da der Poisson exponentiellen Interarrival-Zeiten entspricht, wenn Sie eine nicht exponentielle Interarrival-Zeitverteilung auswählen, ist der resultierende Punktprozess kein Poisson. AdamO wies auf die Weibull hin. Sie können Gamma, Lognormal oder Beta als mögliche Optionen verwenden.
Der Poisson hat die Eigenschaft, dass sein Mittelwert gleich seiner Varianz ist. Ein Punktprozess, dessen Varianz größer als der Mittelwert ist, wird manchmal als überdispers bezeichnet. Wenn der Mittelwert größer als die Varianz ist, ist er unterdispers. Diese Begriffe werden verwendet, um den Prozess mit einem Poisson in Beziehung zu setzen. Das negative Binom wird häufig verwendet, da es abhängig von seinen Parametern über- oder unterdispers sein kann.
Der Poisson hat eine Varianz, die konstant ist. Ein Punktprozess, der den Poisson-Bedingungen entspricht, außer dass er keinen konstanten Ratenparameter und folglich einen zeitlich variierenden Mittelwert und eine Varianz aufweist, wird inhomogenes Poisson genannt.
Ein Prozess mit exponentiellen Interarrival-Zeiten, der jedoch zur Ankunftszeit mehrere Ereignisse aufweisen kann, wird als zusammengesetztes Poisson bezeichnet. Obwohl sie dem Poisson-Prozess ähnlich sind und einen Namen mit dem Wort Poisson enthalten, unterscheiden sich inhomogene und zusammengesetzte Poisson-Prozesse von einem Poisson-Punkt-Prozess.
quelle
Ein weiteres interessantes Beispiel für einen Nicht-Poisson-Zählprozess ist die Null-Poisson-Verteilung (ZTPD). ZTPD kann Daten in Bezug auf die Anzahl der Sprachen, in denen die Probanden unter physiologischen Bedingungen sprechen können, anpassen. In diesem Fall verhält sich die Poisson-Verteilung schlecht, da die Anzahl der gesprochenen Sprachen per Definition> = 1 ist: daher ist 0 von vornherein ausgeschlossen.
quelle
Ich glaube, Sie könnten Ihren Poisson-Prozess zur Kundenankunft auf zwei verschiedene Arten optimieren: 1) Die Kundenankünfte werden rund um die Uhr gemessen, aber der Laden ist nicht den ganzen Tag geöffnet. 2) Stellen Sie sich zwei konkurrierende Läden vor Poisson verarbeitet die Ankunftszeiten der Kunden und untersucht den Unterschied zwischen den Ankünften in den beiden Filialen. (Beispiel 2 stammt aus meinem Verständnis des Springer-Handbuchs für technische Statistik, Teil A, Eigenschaft 1.4.)
quelle
Vielleicht möchten Sie das Fußballbeispiel noch einmal überdenken. Es scheint, dass die Trefferquoten für beide Teams im Laufe des Spiels steigen und sich ändern, wenn die Teams ihre Angriffs- / Verteidigungsprioritäten als Reaktion auf die aktuelle Punktzahl ändern.
Oder verwenden Sie es als Beispiel dafür, wie einfache Modelle überraschend gute Leistungen erbringen, das Interesse an statistischen Untersuchungen zu bestimmten Phänomenen wecken und einen Maßstab für zukünftige Studien liefern, die mehr Daten zur Untersuchung von Diskrepanzen sammeln und Ausarbeitungen vorschlagen.
Dixon & Robinson (1998), "Ein Geburtsmodell für Vereinsfußballspiele", The Statistician , 47 , 3.
quelle
Da es um die Frage geht, die Poisson-Verteilung verständlicher zu machen, werde ich es versuchen, da ich vor kurzem etwas nach Callcenter-Anrufmustern gesucht habe (die mit der Zeit einer speicherlosen, exponentiellen Verteilung folgen).
Ich denke, dass ich mich in ein anderes Tangentialmodell vertiefen muss, das im Wesentlichen die Kenntnis von Poisson erfordert, um zu erkennen, dass es nicht eines ist, das vielleicht etwas verwirrend ist, aber das bin nur ich.
Ich denke, das Problem beim Verstehen von Poisson ist die kontinuierliche Zeitachse, auf der es liegt - da jede Sekunde weitergeht, ist es unwahrscheinlich, dass das Ereignis auftritt -, aber je weiter Sie in der Zukunft fortfahren, desto sicherer ist es Ereignis.
Wirklich, ich denke, es vereinfacht das Verständnis, wenn Sie nur die Zeitachse gegen 'Prüfungen' oder 'Ereignisse' tauschen.
Jemand kann mich korrigieren, wenn dies weit von der Basis entfernt ist, da es meiner Meinung nach eine einfache Erklärung ist, aber ich denke, Sie können den Münzwurf oder das Werfen eines Würfels durch "Zeit bis zum Eintreffen eines Telefonanrufs" ersetzen (was ich meine) in der Regel für Erlang C / Call-Center-Personal verwenden).
Anstelle von "Zeit bis ein Anruf eintrifft" ---- können Sie ihn durch ... "Würfeln bis ein Würfel sechs trifft" ersetzen.
Das folgt der gleichen allgemeinen Logik. Die Wahrscheinlichkeit (wie bei jedem Glücksspiel) ist bei jedem Wurf (oder jeder Minute) völlig unabhängig und speicherlos. Die Wahrscheinlichkeit von „Nr. 6“ sinkt jedoch mit zunehmender Anzahl von Versuchen immer langsamer, aber sicher gegen 0. Es ist einfacher, wenn Sie beide Grafiken sehen (Wahrscheinlichkeit eines Anrufs mit der Zeit im Vergleich zur Wahrscheinlichkeit von sechs mit Würfeln).
Ich weiß nicht, ob das Sinn macht - das hat mir geholfen, es konkret zu fassen. Nun ist die Poisson-Verteilung eher eine Zählung als eine Zeit zwischen Anrufen oder Versuchen, bis eine Sechs gewürfelt wird - aber sie beruht auf dieser Wahrscheinlichkeit.
quelle
Anzahl der Besuche eines einzelnen Kunden im Lebensmittelgeschäft innerhalb eines bestimmten Zeitintervalls.
Nachdem Sie im Lebensmittelgeschäft waren, ist es unwahrscheinlich, dass Sie für eine Weile zurückkehren, es sei denn, Sie haben einen Planungsfehler begangen.
Ich denke, dass die negative Binomialverteilung hier verwendet werden könnte, aber sie ist diskret, wohingegen die Besuche in kontinuierlicher Zeit erfolgen.
quelle