Was ist der Unterschied zwischen der negativen Binomialverteilung und der Binomialverteilung?
Ich habe versucht, online zu lesen, und festgestellt, dass die negative Binomialverteilung verwendet wird, wenn Datenpunkte diskret sind, aber ich denke, dass sogar die Binomialverteilung für diskrete Datenpunkte verwendet werden kann.
categorical-data
data-mining
binomial
negative-binomial
Verbündeter
quelle
quelle
Antworten:
Der Unterschied ist das, woran wir interessiert sind. Beide Distributionen sind aus unabhängigen Bernoulli-Versuchen mit fester Erfolgswahrscheinlichkeit aufgebaut, p .
Bei der Binomialverteilung ist die Zufallsvariable X die Anzahl der in n Versuchen beobachteten Erfolge . Da es eine feste Anzahl von Versuchen gibt, sind die möglichen Werte von X 0, 1, ..., n .
Bei der negativen Binomialverteilung ist die Zufallsvariable Y die Anzahl der Versuche, bis der r- te Erfolg beobachtet wird. In diesem Fall halten erhöhen wir die Anzahl der Versuche , bis wir erreichen r Erfolge. Die möglichen Werte von Y sind r , r + 1 , r + 2 , ... ohne Obergrenze. Die Negativ Binomial können auch in Bezug auf die Anzahl der definiert werden Ausfälle bis zum r - ten Erfolg, statt die Anzahl der Versuche bis zum r - ten Erfolg. Wikipedia definiert auf diese Weise die negative Binomialverteilung.
Um es zusammenzufassen:
Binomial :
Negatives Binomial :
Vielen Dank an Ben Bolker, der mich daran erinnert hat, die Unterstützung der beiden Distributionen zu erwähnen. Er beantwortet eine ähnliche Frage hier .
quelle
Negative Binomialverteilung ist, trotz scheinbar offensichtlicher Beziehung zum Binomial, im Vergleich zur Poisson-Verteilung tatsächlich besser. Alle drei sind übrigens diskret.
In der Praxis ist NB eine Alternative zu Poisson, wenn Sie eine Streuung (Varianz) beobachten, die höher ist als von Poisson erwartet. Poisson ist die erste Wahl, die Sie in Betracht ziehen sollten, wenn Sie mit Zähldaten arbeiten, z. B. einer jährlichen Anzahl von Autounfalltoten in einer Kleinstadt. Der Mittelwert und die Varianz der Poisson-Verteilung werden durch einen Parameter definiert - eine Häufigkeit, die üblicherweise als . Solange Sie geschätzt haben , folgen Ihr Mittelwert und Ihre Varianz. Tatsächlich muss der Mittelwert der Varianz entsprechen.λλ λ
Wenn Ihre Daten darauf hindeuten, dass die Varianz größer ist als der Mittelwert (Überdispersion), schließt dies Poisson aus, und das negative Binom wäre die nächste zu betrachtende Verteilung. Es hat mehr als einen Parameter, daher kann seine Varianz größer sein als der Mittelwert.
Das Verhältnis von NB zu Binomial ergibt sich aus dem zugrunde liegenden Prozess, wie er in der Antwort von @ Jelsema beschrieben wurde. Der Prozess ist verwandt, also auch die Verteilungen, aber wie ich hier erklärt habe, ist der Zusammenhang mit der Poisson-Verteilung in praktischen Anwendungen enger.
UPDATE: Ein weiterer Aspekt ist die Parametrierung. Die Binomialverteilung hat zwei Parameter: p und n. Seine wahre Domäne ist 0 bis n. Insofern ist es nicht nur diskret, sondern auch auf einer endlichen Menge von Zahlen definiert.
Im Gegensatz dazu sind sowohl Poisson als auch NB für eine unendliche Menge nicht negativer Ganzzahlen definiert. Poisson hat einen Parameter , während NB zwei hat: p und r. Beachten Sie, dass diese beiden Parameter nicht haben . Auf diese Weise können Sie sehen, wie NB und Poisson miteinander verbunden sind.nλ n
quelle
Sie sind beide diskret und repräsentieren die Anzahl, wenn Sie eine Stichprobe machen.
quelle