Was ist die normale Annäherung an die Multinomialverteilung?

Antworten:

21

Sie können es mit der multivariaten Normalverteilung auf dieselbe Weise approximieren, wie die Binomialverteilung durch die univariate Normalverteilung approximiert wird. Überprüfen Sie die Elemente der Verteilungstheorie und der multinomialen Verteilung auf den Seiten 15-16-17.

Sei der Vektor Ihrer Wahrscheinlichkeiten. Dann ist der mittlere Vektor der multivariaten Normalverteilung . Die Kovarianzmatrix ist eine symmetrische Matrix. Die diagonalen Elemente sind tatsächlich die Varianz von ; dh , . Das nicht diagonale Element in der i-ten Zeile und der j-ten Spalte ist , wobei nicht gleich .P=(p1,...,pk)np=(np1,np2,...,npk)k×kXinpi(1pi)i=1,2...,kCov(Xi,Xj)=npipjij

Stat
quelle
1
Schauen Sie sich die 2. Referenz an.
Stat
3
Stat, damit diese Antwort für sich allein stehen kann (und gegen Link Rot resistent ist), würde es Ihnen etwas ausmachen, eine Zusammenfassung der Lösung zu geben?
whuber
4
Benötigt dies eine Kontinuitätskorrektur? Wie würden Sie es anwenden?
Jack Aidley
2
Die Kovarianzmatrix ist nicht positiv definit, sondern positiv semi-definit und nicht vollrangig. Dies macht die resultierende multinormale Verteilung undefiniert. Dies ist das Problem, mit dem ich konfrontiert war. Irgendeine Idee, wie man damit umgeht?
M. Alaggan
2
@ M.Alaggan: Die hier definierten Mittelwert- / Kovarianzmatrizen haben ein kleines Problem: Für eine Multinomialverteilung mit Variablen hat die äquivalente multivariate Normalen Variablen. Dies zeigt das einfache Binomialbeispiel, das durch die (gewöhnliche) Normalverteilung angenähert wird. Weitere Informationen finden Sie in Beispiel 12.7 der Elemente der Verteilungstheorie . kk1
MS Dousti
1

Die in dieser Antwort angegebene Dichte ist entartet, und so habe ich Folgendes verwendet, um die Dichte zu berechnen, die sich aus der normalen Näherung ergibt:

Es gibt einen Satz, der besagt, dass eine Zufallsvariable für einen dimensionalen Vektor mit und , das;X=[X1,,Xm]TMultinom(n,p)mpipi=1iXi=n

Xdndiag(u)Q[Z1Zm10]+[np1npm],

für großes gegeben;n

  • ein Vektor mit ;uui=pi
  • Zufallsvariablen für und;ZiN(0,1)i=1,,m1
  • eine orthogonale Matrix mit der letzten Spalte .Qu

Das heißt, mit einer gewissen Umlagerung können wir eine dimensionale multivariate Normalverteilung für die ersten Komponenten von (die die einzigen interessanten Komponenten sind, da die Summe der anderen ist).m1m1XXm

Ein geeigneter Wert der Matrix ist mit - dh einer bestimmten Householder-Transformation.QI2vvTvi=(δimui)/2(1um)

Wenn wir die linke Seite auf die ersten Zeilen beschränken und auf die ersten Zeilen und Spalten beschränken (bezeichnen diese bzw. ), dann:m1Qm1m1XX^QQ^

X^dndiag(u^)Q^[Z1Zm1]+[np1npm1]N(μ,nΣ),

n

  • u^m1u
  • μ=[np1,,npm1]T
  • nΣ=nAATA=diag(u^)Q^

Die rechte Seite dieser endgültigen Gleichung ist die nicht entartete Dichte, die bei der Berechnung verwendet wird.

Wenn Sie alles anschließen, erhalten Sie erwartungsgemäß die folgende Kovarianzmatrix:

(nΣ)ij=npipj(δijpipj)

i,j=1,,m1m1m1

Dieser Blogeintrag war mein Ausgangspunkt.

Stephematiker
quelle
1
Eine weitere nützliche Ressource sind die Links unter: stats.stackexchange.com/questions/2397/…
stephematician
1
Gute Antwort (+1) --- Beachten Sie, dass Sie Links mit der Syntax einbetten können [textual description](hyperlink). Ich habe mir erlaubt, diese Antwort zu bearbeiten, um Ihre Links einzubetten.
Ben - Monica