Ich versuche, die Aktualisierungsgleichungen für das Konjugat an die Dirichlet-Verteilung abzuleiten, wie hier beschrieben: /mathpro/20399/conjugate-prior-of-the-dirichlet-distribution
Die von mir berechnete Parameteraktualisierungsgleichung stimmt jedoch nicht mit der dort vorgeschlagenen überein.
Meine Ableitung ist unten dargestellt:
where,
f(θ|α)=Dir(θ|α)=1B(α)exp(ϕ(α)Tu(θ))
ϕ(α)Tu(θ)B(α)=[α1−1,⋯,αK−1]=[ln(θ1),⋯,ln(θK)]T=∏Ki=1Γ(αi)Γ(∑Ki=1αi)
Also
f(θ|α)=1B(α)exp(∑i=1Kαiln(θi)−ln(θi))
Das konjugierte Familienkonjugat hat die Form
p ( α | ν, η)∝1B ( α)ηexp( ϕ ( α)T.ν)=1B ( α)ηexp(∑i = 1K.αichνich- -∑i = 1K.νich)∝1B ( α)ηexp(∑i = 1K.αichνich)
Nun ist das hintere Update auf gegeben ,
αθ
p ( α | θ , ν, η)∝ p ( α , θ | ν, η)= f( θ | α ) p ( α | ν, η)∝ [1B ( α )exp(∑i = 1K.αichln(θich) - ln(θich) ) ] ×∝ [1B ( α)ηexp(∑i = 1K.αichνich) ]=1B ( α)η+ 1exp(∑i = 1K.αichln(θich) +αichνich- - ln(θich) )
Daher erhalte ich das Update . Das Update auf stimmt jedoch nicht überein. Wenn wir das , würden wir das Update , das nicht mit dem vorgeschlagenen übereinstimmt .ηt + 1=ηt+ 1ν- - ln(θich)νt + 1ich=νtich+ ln(θich)νt + 1ich=νtich- - ln(θich)
Und ein Follow-up: Gibt es eine intuitive Bedeutung hinter und in diesem Konjugat? scheint das Maß an Vertrauen in den Prior anzuzeigen, und Asymmetrie, aber eine weitere Diskussion darüber wäre wünschenswert.ηνην
Antworten:
An dieser Ableitung ist nichts auszusetzen: aber der Teil spielt keine Rolle, da es sich um eine multiplikative Konstante (in ) handelt. Deshalb
Für die Folgefrage glaube ich nicht, dass die Verteilung eine intuitive Interpretation hat.
quelle
Erstens sind exponentielle Familienaktualisierungen alles andere als die natürliche Parametrisierung verwirrend, bei der die Aktualisierungsregel nur eine Ergänzung ist. Halten Sie sich an diese Parametrisierung.
Ich würde das Konjugat vorher auf diese Weise ableiten . Die Grundidee ist die natürlichen Parameterwert Ihres Konjugat vor Verteilung sind (Summen ausreichend Statistiken Ihrer ursprünglichen Verteilung ). Jede Beobachtung addiert sich zu diesem Vektor.F′ η′ F
Die ausreichenden Statistiken für das Dirichlet sind . Daher besteht Ihre Aktualisierungsregel für das konjugierte Prior darin, diese zusammen mit einem zusätzlichen Parameter zusammenzufassen, der festhält, wie viele Beobachtungen Sie summiert haben.logxi
Intuitiv ist dieser Zählparameter immer ein Konzentrationsparameter; Die anderen Parameter reagieren am empfindlichsten auf kleine Werte von . Es macht Sinn , dass , wenn Ihr Dirichlet Probe einen kleinen Wert von , dann wahrscheinlich nicht über einen großen im Vergleich zu dem anderen . Das Gegenteil ist vielleicht weniger wahr?xi xi αi αi
quelle
Ich bin mir nicht sicher, ob es einen intuitiven Sinn ergibt , aber kann in einem physikalischen Kontext interpretiert werden, wie weit die Dirichlet-Verteilung im mikrokanonischen Sinne vom Gleichgewicht entfernt ist. Siehe http://arxiv.org/pdf/cond-mat/0603120v1.pdf . Dies ist wahrscheinlich nicht die Art von Interpretation, die die meisten als befriedigend empfinden würden, aber es ist eine interessante Sichtweise!η
quelle