Beziehung zwischen Poisson-, Binomial-, negativen Binomialverteilungen und Normalverteilung

7

Wenn wir diskrete Zählungsverteilungen definieren müssen, verwenden wir normalerweise:

  • Poissonverteilung, wenn Mittelwert = Varianz
  • Binomialverteilung, wenn Mittelwert> Varianz
  • Negative Binomialverteilung, wenn Mittelwert <Varianz

Meine Frage ist, ist es möglich, die Normalverteilung zur Annäherung zu verwenden? Um beispielsweise eine Poisson-Verteilung (mit Mittelwert = 4) zu haben, beginnen wir mit einer Normalverteilung (mit Mittelwert = Varianz = 4).

x=seq(0,20,1)
plot(x,dpois(x,4))
points(x,dnorm(x,4,2),col=2)

Wir können sehen, dass die beiden Dichten nicht sehr unterschiedlich sind. Wenn wir nun Schwellenwerte und einige Regeln definieren:

  • Wenn das Ergebnis des Normalgesetzes negativ ist, ist es 0
  • für x = 6,2 ist es 6 usw. usw.

Ist es möglich, eine solche Annäherung an die Normalverteilung zu verwenden, um eine Poisson-Verteilung vollständig zu definieren? Gleiches gilt für negatives Binomial und Binomial.

Warum versuche ich das? Wenn wir versuchen, eine Poisson-Verteilung mit realen Daten zu definieren, haben wir normalerweise nie Mittelwert = Varianz. Wenn wir also eine Poisson-Verteilung verwenden, liegt dies daran, dass wir ungefähr diesen Zustand haben. Wir müssen diese drei Fälle mit dem geschätzten Mittelwert und der geschätzten Varianz (aus realen Daten) diskutieren.

Meine Idee ist es also, immer zu verwenden

  • das empirische Mittel und die Varianz, um eine Normalverteilung zu definieren
  • Dann definieren Sie einige "Regeln" in Abhängigkeit von diesen Parametern
  • Damit wir den Mittelwert und die Varianz anhand simulierter Daten zu diskreten Zählungen berechnen können, können wir den anfänglichen empirischen Mittelwert und die Varianz überprüfen.

Was halten Sie von dieser Methode, wenn es darum geht, diskrete Zähldaten zu simulieren, anstatt Poisson-, Binomial- oder negative Binomialverteilung zu verwenden?

Xiaoshi
quelle

Antworten:

9
  • Die Binomialverteilung ist die Verteilung der Anzahl der Erfolge in einer festen (dh nicht zufälligen) Anzahl unabhängiger Versuche mit der gleichen Erfolgswahrscheinlichkeit für jeden Versuch. Es unterstützt die Menge , die endlich ist, wobei die Anzahl der Versuche ist.{0,1,2,,n}n

  • Die negative Binomialverteilung ist die Verteilung der Anzahl von Fehlern vor einer festen (dh nicht zufälligen) Anzahl von Erfolgen, wiederum mit unabhängigen Versuchen und der gleichen Erfolgswahrscheinlichkeit bei jedem Versuch. Seine Unterstützung ist die Menge , die unendlich ist.{0,1,2,3,}

  • Die Poisson-Verteilung kann lose als die Anzahl der Erfolge in einer unendlichen Anzahl unabhängiger Versuche mit einer unendlich geringen Erfolgswahrscheinlichkeit bei jedem Versuch charakterisiert werden, bei dem die erwartete Anzahl der Erfolge eine feste positive Zahl ist. Es ist eine Grenze der Binomialverteilung , in dem die Anzahl der Versuche erreicht und die Erfolgswahrscheinlichkeit bei jedem Versuch nähert sich derart , dass die erwartete Anzahl der Erfolge bleibt konstant oder zumindest Ansätze einige positive Zahl.0

Es ist wahr, dass für die Binomialverteilung der Mittelwert größer als die Varianz ist, für die negative Binomialverteilung der Mittelwert kleiner als die Varianz ist und für die Poisson-Verteilung sie gleich sind.

Es ist jedoch nicht wahr, dass für jede Verteilung, deren Unterstützung eine Menge von Kardinalzahlen ist, wenn der Mittelwert gleich der Varianz ist, es sich um eine Poisson-Verteilung handelt, und dass, wenn der Mittelwert größer als die Varianz ist, es sich um eine Binomialverteilung handelt, oder dass wenn Der Mittelwert ist kleiner als die Varianz. Es handelt sich um eine negative Binomialverteilung. Beispielsweise ist der Mittelwert der hypergeometrischen Verteilung, der sich aus der ersatzlosen Abtastung ergibt, größer als die Varianz, wie bei der Binomialverteilung, aber die Verteilung ist nicht dieselbe. Für die Gleichverteilung auf der Menge , wenn{0,1,2,,n}n>4dann ist die Varianz größer als der Mittelwert, wie bei der negativen Binomialverteilung, aber die Verteilung ist nicht dieselbe. Für die Gleichverteilung auf der Menge ist die Varianz wie bei der Poisson-Verteilung gleich dem Mittelwert, aber die Verteilung ist nicht dieselbe.{0,2}

Wenn dann denn wenn groß ist, ist die Verteilung von dieselbe wie die Verteilung der Summe einer großen Anzahl von Poisson-verteilten Zufallsvariablen, deren Summe nahe . Dies liegt daran, dass die Summe der unabhängigen Poisson-verteilten Zufallsvariablen Poisson-verteilt ist, sodass der zentrale Grenzwertsatz angewendet werden kann.XPoisson(λ)

XλλD.N(0,1) as λ
λX1

Wenn dann da dieselbe Verteilung hat wie die Summe von unabhängigen Zufallsvariablen, die als , gilt also wieder der zentrale Grenzwertsatz.XBinomial(n,p)

Xnpnp(1p)D.N(0,1) as n
XnBinomial(1,p)

Die negative Binomialverteilung mit den Parametern ist die Verteilung der Anzahl der Fehler vor dem ten Erfolg mit der Erfolgswahrscheinlichkeit bei jedem Versuch. Wenn so verteilt ist, haben wir da die gleiche Verteilung hat wie die Summe von unabhängigen Zufallsvariablen, die als negatives Binom mit den Parametern sind. Daher gilt wieder der zentrale Grenzwertsatz.r,prpX.

X.- -(pr/.(1- -p))pr/.(1- -p)D. D.N.(0,1) wie r
X.r1,p

Wenn Sie eine dieser Arten von Verteilungen mit einer Normalverteilung approximieren, beachten Sie, dass das gerade mit dem Ereignis identisch ist. Verwenden Sie daher die Kontinuitätskorrektur, in der Sie die Wahrscheinlichkeit finden, dass gemäß der Normalverteilung.[X.n]][X.<n+1]][X.n+12]]

Michael Hardy
quelle