Negative Binomialverteilung vs. Binomialverteilung

22

Was ist der Unterschied zwischen der negativen Binomialverteilung und der Binomialverteilung?

Ich habe versucht, online zu lesen, und festgestellt, dass die negative Binomialverteilung verwendet wird, wenn Datenpunkte diskret sind, aber ich denke, dass sogar die Binomialverteilung für diskrete Datenpunkte verwendet werden kann.

categorical-data data-mining binomial negative-binomial Verbündeter
quelle

5

Sie sind beide diskret.

Glen_b

5

Einfache Illustration: Sie verkaufen Süßigkeiten von Tür zu Tür. An jeder Tür, an die Sie klopfen, haben Sie die Wahrscheinlichkeit, dass Sie 1 Schokoriegel zu 1/4 und 0 Schokoriegel zu 3/4 verkaufen. Ihre Wahrscheinlichkeit, n Bars zu verkaufen, wenn Sie an 50 Türen klopfen, ist eine Binomialverteilung in n. Ihre Wahrscheinlichkeit, an m Tür klopfen zu müssen, um 30 Bars zu verkaufen, ist eine negative Binomialverteilung in m. Beachten Sie, dass der erste bei 50 abschneidet, weil Sie nicht mehr als 50 Riegel verkaufen können, während der zweite bei unendlich abschneidet, weil Sie an diesem Tag einfach schreckliches Glück haben und niemals den 30. Riegel verkaufen können.

Jerry Guern

30

Der Unterschied ist das, woran wir interessiert sind. Beide Distributionen sind aus unabhängigen Bernoulli-Versuchen mit fester Erfolgswahrscheinlichkeit aufgebaut, p .

Bei der Binomialverteilung ist die Zufallsvariable X die Anzahl der in n Versuchen beobachteten Erfolge . Da es eine feste Anzahl von Versuchen gibt, sind die möglichen Werte von X 0, 1, ..., n .

Bei der negativen Binomialverteilung ist die Zufallsvariable Y die Anzahl der Versuche, bis der r- te Erfolg beobachtet wird. In diesem Fall halten erhöhen wir die Anzahl der Versuche , bis wir erreichen r Erfolge. Die möglichen Werte von Y sind r , r + 1 , r + 2 , ... ohne Obergrenze. Die Negativ Binomial können auch in Bezug auf die Anzahl der definiert werden Ausfälle bis zum r - ten Erfolg, statt die Anzahl der Versuche bis zum r - ten Erfolg. Wikipedia definiert auf diese Weise die negative Binomialverteilung.

Um es zusammenzufassen:

Binomial :

Feste Anzahl von Versuchen ( n )
Feste Erfolgswahrscheinlichkeit ( p )
Zufällige Variable ist X = Anzahl der Erfolge.
Mögliche Werte sind 0 ≤ X ≤ n

Negatives Binomial :

Feste Anzahl Erfolge ( r )
Feste Erfolgswahrscheinlichkeit ( p )
Zufallsvariable Y = Anzahl der Versuche bis zum r - ten Erfolg.
Mögliche Werte sind r ≤ Y

Vielen Dank an Ben Bolker, der mich daran erinnert hat, die Unterstützung der beiden Distributionen zu erwähnen. Er beantwortet eine ähnliche Frage hier .

Jelsema
quelle

4

Weitere Informationen zu NB finden Sie hier: stats.stackexchange.com/questions/6728/… . Es kann erwähnenswert sein, dass binomiale Antworten begrenzt sind [0, N], NB Antworten sind unbegrenzt [0, ...]

Ben Bolker

Guter Punkt, ich habe meine Antwort aktualisiert, um dies einzuschließen.

Jelsema

danke jelsema für die ausführliche antwort, ich könnte es jetzt besser verstehen

alily

19

Negative Binomialverteilung ist, trotz scheinbar offensichtlicher Beziehung zum Binomial, im Vergleich zur Poisson-Verteilung tatsächlich besser. Alle drei sind übrigens diskret.

In der Praxis ist NB eine Alternative zu Poisson, wenn Sie eine Streuung (Varianz) beobachten, die höher ist als von Poisson erwartet. Poisson ist die erste Wahl, die Sie in Betracht ziehen sollten, wenn Sie mit Zähldaten arbeiten, z. B. einer jährlichen Anzahl von Autounfalltoten in einer Kleinstadt. Der Mittelwert und die Varianz der Poisson-Verteilung werden durch einen Parameter definiert - eine Häufigkeit, die üblicherweise als . Solange Sie geschätzt haben , folgen Ihr Mittelwert und Ihre Varianz. Tatsächlich muss der Mittelwert der Varianz entsprechen. $\lambda$ $\lambda$

Wenn Ihre Daten darauf hindeuten, dass die Varianz größer ist als der Mittelwert (Überdispersion), schließt dies Poisson aus, und das negative Binom wäre die nächste zu betrachtende Verteilung. Es hat mehr als einen Parameter, daher kann seine Varianz größer sein als der Mittelwert.

Das Verhältnis von NB zu Binomial ergibt sich aus dem zugrunde liegenden Prozess, wie er in der Antwort von @ Jelsema beschrieben wurde. Der Prozess ist verwandt, also auch die Verteilungen, aber wie ich hier erklärt habe, ist der Zusammenhang mit der Poisson-Verteilung in praktischen Anwendungen enger.

UPDATE: Ein weiterer Aspekt ist die Parametrierung. Die Binomialverteilung hat zwei Parameter: p und n. Seine wahre Domäne ist 0 bis n. Insofern ist es nicht nur diskret, sondern auch auf einer endlichen Menge von Zahlen definiert.

Im Gegensatz dazu sind sowohl Poisson als auch NB für eine unendliche Menge nicht negativer Ganzzahlen definiert. Poisson hat einen Parameter , während NB zwei hat: p und r. Beachten Sie, dass diese beiden Parameter nicht haben . Auf diese Weise können Sie sehen, wie NB und Poisson miteinander verbunden sind. $\lambda$ $n$

Aksakal
quelle

3

Ich verstehe nicht, was Sie mit "besser im Vergleich zur Poisson-Verteilung" meinen. Die ursprüngliche Frage sagt nichts darüber aus, welche Art von Modellierung gewünscht wird. Es bedeutet nicht einmal, dass man sich überhaupt für das Modellieren interessiert.

Heropup

@heropup, OP ist eindeutig an Anwendungen interessiert und vergleicht NB direkt mit Binomial. Daher geht es in meiner Antwort um diesen Vergleich, und dieser Vergleich mit Poisson ist für typische Anwendungen relevanter.

Aksakal

7

Sie sind beide diskret und repräsentieren die Anzahl, wenn Sie eine Stichprobe machen.

$D$ $N$ $S = ( DDD, DDN, DND, DNN, NDD, NDN, NND, NNN)$

$S = ( D,ND,NND,NNND,... )$

$p$

Bahgat Nassour
quelle

Negative Binomialverteilung vs. Binomialverteilung

Antworten: