Sicher. Dies ist im Wesentlichen die Beobachtung, dass die Dirichlet-Verteilung ein konjugiertes Prior ist der Multinomialverteilung ist. Dies bedeutet, dass sie die gleiche funktionale Form haben. Der Artikel erwähnt es, aber ich möchte nur betonen, dass dies aus dem multinomialen Stichprobenmodell folgt. Also, los geht's ...
Bei der Beobachtung geht es um den posterioren Bereich. Lassen Sie uns also einige Daten einführen , bei denen es sich um K verschiedene Elemente handelt. Wir beobachten insgesamt N = ∑ K i = 1 x i Proben. Wir nehmen an, dass x aus einer unbekannten Verteilung π gezogen wird (auf die wir ein D i r ( α ) vor das K setzenxKN=∑Ki=1xixπDir(α)K Implex setzen).
Die hintere Wahrscheinlichkeit von bei α und Daten x istπαx
p(π|x,α)=p(x|π)p(π|α)
Die Wahrscheinlichkeit ist die Multinomialverteilung. Schreiben wir nun die PDFs aus:p(x|π)
p(x|π)=N!x1!⋯xk!πx11⋯πxkk
und
p(π|α)=1B(α)∏i=1Kπα−1i
wobei . Multiplizieren, das finden wir,B(α)=Γ(α)KΓ(Kα)
p(π|α,x)=p(x|π)p(π|α)∝∏i=1Kπxi+α−1i.
Mit anderen Worten, der hintere ist auch Dirichlet. Die Frage betraf den hinteren Mittelwert. Da der hintere Dirichlet ist, können wir die Formel für den Mittelwert eines Dirichlets anwenden , um dies zu finden:
E[πi|α,x]=xi+αN+Kα.
Hoffe das hilft!
As a side note, I would also like to add another point to the above derivation, which it's not really concerning the main question. However, talking about Dirichlet priors on multinomial distribution, I thought it worth to mention that what would be the form of likelihood function if we're going to take probabilities as nuisance variables.
As it's correctly pointed out by by sydeulissie, thep(π|α,x) is proportional to ∏Ki=1πxi+α−1i . Now here I would like to calculate p(x|α) .
Using an integral identity for gamma functions, we have:
The above derivation of the likelihood for categorical data proposes a more robust way of dealing with this data for cases that the sample sizeN is not so big enough.
quelle