Ich kenne Normalitätstests, aber wie prüfe ich auf "Poisson-Ness"?
Ich habe eine Stichprobe von ~ 1000 nicht-negativen ganzen Zahlen, von denen ich vermute, dass sie aus einer Poisson-Verteilung stammen, und ich würde das gerne testen.
Ich kenne Normalitätstests, aber wie prüfe ich auf "Poisson-Ness"?
Ich habe eine Stichprobe von ~ 1000 nicht-negativen ganzen Zahlen, von denen ich vermute, dass sie aus einer Poisson-Verteilung stammen, und ich würde das gerne testen.
Zunächst einmal rate ich Ihnen, eine Poisson-Distribution nicht so auszuprobieren, wie es für die Daten der Fall ist. Ich schlage vor, Sie müssen zunächst eine Theorie erstellen, warum die Poisson-Verteilung zu einem bestimmten Datensatz oder Phänomen passt.
Sobald Sie dies festgestellt haben, lautet die nächste Frage, ob die Verteilung homogen ist oder nicht. Dies bedeutet, ob alle Teile der Daten von derselben Poisson-Verteilung behandelt werden oder ob dies aufgrund eines Aspekts wie Zeit oder Raum variiert. Probieren Sie die folgenden drei Tests aus, wenn Sie von diesen Aspekten überzeugt sind:
Suchen Sie nach diesen und Sie werden sie leicht im Netz finden.
Hier ist eine Folge von R-Befehlen, die hilfreich sein können. Fühlen Sie sich frei zu kommentieren oder zu bearbeiten, wenn Sie Fehler entdecken.
quelle
Ich nehme an, der einfachste Weg ist einfach ein Chi-Quadrat- Fit- Test.
Tatsächlich ist hier ein nettes Java-Applet , das genau das macht!
quelle
Sie können die Streuung (Verhältnis der Varianz zum Mittelwert) als Teststatistik verwenden, da das Poisson eine Streuung von 1 ergeben sollte. Hier finden Sie einen Link zur Verwendung als Modelltest.
quelle
Bei einer Poisson-Verteilung entspricht der Mittelwert der Varianz. Wenn Ihr Stichprobenmittelwert stark von Ihrer Stichprobenvarianz abweicht, haben Sie wahrscheinlich keine Poisson-Daten. Der hier ebenfalls erwähnte Dispersionstest ist eine Formalisierung dieses Begriffs.
Wenn Ihre Varianz viel größer als Ihr Mittelwert ist, wie es normalerweise der Fall ist, sollten Sie als Nächstes eine negative Binomialverteilung versuchen.
quelle
Sie können eine einzelne Figur zeichnen, in der die beobachteten und erwarteten Frequenzen nebeneinander gezeichnet werden. Wenn die Verteilungen sehr unterschiedlich sind und Sie auch ein Varianz-Mittelwert-Verhältnis größer als eins haben, ist das negative Binomial ein guter Kandidat. Lesen Sie den Abschnitt Häufigkeitsverteilungen von
The R Book
. Es handelt sich um ein sehr ähnliches Problem.quelle
Ich denke, der wichtigste Punkt ist der, den Sidmaestro anspricht. Unterstützt der experimentelle Aufbau oder der Datengenerierungsmechanismus die Annahme, dass die Daten aus einer Poisson-Verteilung stammen könnten?
Ich bin kein großer Fan von Tests auf Verteilungsannahmen, da diese Tests normalerweise nicht sehr nützlich sind. Was mir nützlicher erscheint, ist, Verteilungs- oder Modellannahmen zu treffen, die flexibel und relativ robust gegenüber Abweichungen vom Modell sind, typischerweise zum Zweck der Schlussfolgerung. Nach meiner Erfahrung ist es nicht üblich, Mittelwert = Varianz zu sehen, weshalb das negative Binomialmodell oft angemessener erscheint und den Poisson als Sonderfall einschließt.
Ein weiterer wichtiger Punkt beim Testen der Distribution ist, dass Sie sicherstellen, dass keine Schichten beteiligt sind, die Ihre beobachtete Distribution zu einer Mischung aus anderen Distributionen machen. Einzelne schichtenspezifische Verteilungen können in Poisson vorkommen, die beobachtete Mischung jedoch möglicherweise nicht. Eine analoge Situation aus der Regression geht nur davon aus, dass die bedingte Verteilung von Y | X normal verteilt ist und nicht wirklich die Verteilung von Y selbst.
quelle
Ein weiterer Weg, dies zu testen, ist ein Quantil-Quantil-Plot. In R gibt es qqplot. Hiermit werden Ihre Werte direkt gegen eine Normalverteilung mit ähnlichem Mittelwert und SD aufgetragen
quelle