Verteilung, die den Unterschied zwischen negativen binomialverteilten Variablen beschreibt?

18

Eine Skellam-Verteilung beschreibt den Unterschied zwischen zwei Variablen mit Poisson-Verteilungen. Gibt es eine ähnliche Verteilung, die den Unterschied zwischen Variablen beschreibt, die auf negative Binomialverteilungen folgen?

Meine Daten werden nach einem Poisson-Verfahren erstellt, enthalten jedoch einiges an Rauschen, was zu einer Überdispersion in der Verteilung führt. Daher funktioniert die Modellierung der Daten mit einer negativen Binomialverteilung (NB) gut. Welche Optionen stehen zur Verfügung, wenn ich den Unterschied zwischen zwei dieser NB-Datensätze modellieren möchte? Wenn es hilft, nehmen Sie ähnliche Mittel und Varianz für die beiden Sätze an.

Chrisamiller
quelle
Es gibt viele leicht zu beschreibende Distributionen, die keine Standardnamen haben.
Glen_b

Antworten:

22

Ich kenne den Namen dieser Distribution nicht, aber Sie können ihn einfach aus dem Gesetz der Gesamtwahrscheinlichkeit ableiten. Angenommen, jeweils negative Binomialverteilungen mit Parametern bzw. . Ich verwende die Parametrisierung, wobei die Anzahl der Erfolge vor dem jeweils 'ten und ' ten Fehler darstellen. Dann,( r 1 , p 1 ) ( r 2 , p 2 ) X , Y r 1 r 2X,Y.(r1,p1)(r2,p2)X,Y.r1r2

P(X-Y.=k)=EY.(P(X-Y.=k))=EY.(P(X=k+Y.))=y=0P(Y.=y)P(X=k+y)

Wir wissen

P(X=k+y)=(k+y+r11k+y)(1p1)r1p1k+y

und

P(Y=y)=(y+r2-1y)(1-p2)r2p2y

so

P(X-Y.=k)=y=0(y+r2-1y)(1-p2)r2p2y(k+y+r1-1k+y)(1-p1)r1p1k+y

Das ist nicht hübsch (yikes!). Die einzige Vereinfachung, die ich gleich sehe, ist

p1k(1-p1)r1(1-p2)r2y=0(p1p2)y(y+r2-1y)(k+y+r1-1k+y)

Das ist immer noch ziemlich hässlich. Ich bin nicht sicher, ob dies hilfreich ist, aber dies kann auch als umgeschrieben werden

p1k(1-p1)r1(1-p2)r2(r1-1)!(r2-1)!y=0(p1p2)y(y+r2-1)!(k+y+r1-1)!y!(k+y)!

Ich bin nicht sicher, ob es einen vereinfachten Ausdruck für diese Summe gibt, aber er könnte numerisch angenähert werden, wenn Sie ihn nur zur Berechnung von Werten benötigenp

Ich habe mit der Simulation bestätigt, dass die obige Berechnung korrekt ist. Hier ist eine grobe R-Funktion, um diese Massenfunktion zu berechnen und einige Simulationen durchzuführen

  f = function(k,r1,r2,p1,p2,UB)  
  {

  S=0
  const = (p1^k) * ((1-p1)^r1) * ((1-p2)^r2)
  const = const/( factorial(r1-1) * factorial(r2-1) ) 

  for(y in 0:UB)
  {
     iy = ((p1*p2)^y) * factorial(y+r2-1)*factorial(k+y+r1-1)
     iy = iy/( factorial(y)*factorial(y+k) )
     S = S + iy
  }

  return(S*const)
  }

 ### Sims
 r1 = 6; r2 = 4; 
 p1 = .7; p2 = .53; 
 X = rnbinom(1e5,r1,p1)
 Y = rnbinom(1e5,r2,p2)
 mean( (X-Y) == 2 ) 
 [1] 0.08508
 f(2,r1,r2,1-p1,1-p2,20)
 [1] 0.08509068
 mean( (X-Y) == 1 ) 
 [1] 0.11581
 f(1,r1,r2,1-p1,1-p2,20)
 [1] 0.1162279
 mean( (X-Y) == 0 ) 
 [1] 0.13888
 f(0,r1,r2,1-p1,1-p2,20)
 [1] 0.1363209

Ich habe festgestellt, dass die Summe für alle Werte, die ich ausprobiert habe, sehr schnell konvergiert. Daher ist es nicht erforderlich, UB auf einen Wert über 10 festzulegen. Beachten Sie, dass R in rnbinom Funktion eingebaut parametrisiert die negative binomische in Bezug auf die Anzahl der Ausfälle vor dem -ten Erfolg, in dem Fall , dass Sie alle die ersetzen , bräuchten 's in der obige Formeln mit zur Kompatibilität.rp1,p21-p1,1-p2

Makro
quelle
Vielen Dank. Ich brauche etwas Zeit, um das zu verdauen, aber Ihre Hilfe wird sehr geschätzt.
Chrisamiller
-2

Ja. Die verzerrte generalisierte diskrete Laplace-Verteilung ist die Differenz zweier negativer binomialverteilter Zufallsvariablen. Weitere Erläuterungen finden Sie im online verfügbaren Artikel "skewed generalized discrete Laplace distribution" von seetha Lekshmi.V. und simi sebastian

Simi Sebastian
quelle
4
Können Sie ein vollständiges Zitat und eine Zusammenfassung der Informationen in der Zeitung bereitstellen, damit zukünftige Leser entscheiden können, ob sie etwas unternehmen möchten?
gung - Wiedereinsetzung von Monica
Der von @ simi-sebastian (der Autor?) Erwähnte Artikel ist ijmsi.org/Papers/Volume.2.Issue.3/K0230950102.pdf . Wenn ich mich nicht irre, wird nur der Fall der negativen Binomialvariablen und angesprochen, die beide den gleichen Dispersionsparameter haben, und nicht der allgemeinere Fall, der im Originalposter beschrieben wird. XY.
Constantinos