Sei eine gemeinsame Verteilung zweier kategorialer Variablen mit . Angenommen, es wurden Stichproben aus dieser Verteilung gezogen, aber wir erhalten nur die Grenzwerte, nämlich für :
Was ist der Maximum-Likelihood-Schätzer für bei ? Ist das bekannt? Rechnerisch machbar? Gibt es andere sinnvolle Ansätze für dieses Problem als ML?
maximum-entropy
Tag benutzt? Sind Sie auf der Suche nach einer Lösung mit maximaler Entropie?Antworten:
Diese Art von Problem wurde in der Arbeit "Data Augmentation in Mehrwege-Kontingenztabellen mit festen Randwerten" von Dobra et al. (2006) untersucht. Lassen der Parameter des Modells bezeichnen, lassen n die unbeobachtet integer Tabelle von Zählungen für jedes bezeichnen ( x , y ) Paar, und lassen C ( S , T ) die Menge von ganzzahligen Tabellen , deren Rand Zählungen gleich ( S , T ) . Dann zählt die Wahrscheinlichkeit der Einhaltung der Grenzwerteθ n (x,y) C(S,T) (S,T) :
p ((S,T)
wobei p ( n | θ ) die multinomiale Abtastverteilung ist. Dies definiert die Wahrscheinlichkeitsfunktion für ML, eine direkte Bewertung ist jedoch mit Ausnahme kleiner Probleme nicht möglich. Der empfohlene Ansatz ist MCMC, bei dem Sie abwechselnd n und θ aktualisieren
Ein anderer Ansatz würde Variationsmethoden verwenden, um die Summe über zu approximieren . Die Randbedingungen können als ein Faktorgraph codiert werden und eine Inferenz über & thgr ; könnte unter Verwendung von Expectation Propagation durchgeführt werden.n θ
Um zu sehen, warum dieses Problem schwierig ist und keine triviale Lösung zulässt, betrachten Sie den Fall . Ausgehend von S als Zeilensummen und T als Spaltensummen gibt es zwei mögliche Zähltabellen: [ 0 1 2 0 ]S=(1,2),T=(2,1) S T
Daher ist die Wahrscheinlichkeitsfunktion
p(S,T | & thgr;)=3 p 12 p 2 21 +6 p 11 p 21 p 22
Das MLE für dieses Problem ist
, p x , y = [ 0 1 / 3 2 / 3 0 ]
quelle
Wie von @Glen_b gezeigt wurde, ist dies nicht ausreichend spezifiziert. Ich glaube nicht, dass Sie die maximale Wahrscheinlichkeit verwenden können, es sei denn, Sie können die Wahrscheinlichkeit vollständig angeben.
Wenn Sie bereit wären, Unabhängigkeit anzunehmen, ist das Problem recht einfach (ich denke übrigens, die Lösung wäre die maximale Entropielösung, die vorgeschlagen wurde). Wenn Sie nicht bereit oder in der Lage sind, Ihrem Problem eine zusätzliche Struktur aufzuerlegen, und dennoch eine Annäherung an die Werte der Zellen wünschen, können Sie möglicherweise die Fréchet-Hoeffding-Copula-Grenzen verwenden . Ohne zusätzliche Annahmen glaube ich nicht, dass Sie noch weiter gehen können.
quelle
Edit: This answer is based on an incorrect assumption that likelihood of the marginal counts givenpx,y is only a function of the marginal probabilities px=∑ypx,y and py=∑xpx,y . I'm still thinking about it.
Wrong stuff follows:
As mentioned in a comment, the problem with finding "the" maximum-likelihood estimator forpx,y is that it's not unique. For instance, consider the case with binary X,Y and marginals S1=S2=T1=T2=10 . The two estimators
have the same marginal probabilitiespx and py in all cases, and hence have equal likelihoods (both of which maximize the likelihood function, as you can verify).
Indeed, no matter what the marginals are (as long as two of them are nonzero in each dimension), the maximum likelihood solution is not unique. I'll prove this for the binary case. Letp=(acbd) be a maximum-likelihood solution. Without loss of generality suppose 0<a≤d . Then p=(0c+ab+ad−a) has the same marginals and is thus also a maximum-likelihood solution.
If you want to additionally apply a maximum-entropy constraint, then you do get a unique solution, which as F. Tussell stated is the solution in whichX,Y are independent. You can see this as follows:
The entropy of the distribution isH(p)=−∑x,ypx,ylogpx,y ; maximizing subject to ∑xpx,y=py and ∑ypx,y=px (equivalently, g⃗ (p)=0 where gx(p)=∑ypx,y−px and gy(p)=∑xpx,y−py ) using Lagrange multipliers gives the equation:
All the gradients of eachgk are 1, so coordinate-wise this works out to
plus the original constraints∑xpx,y=py and ∑ypx,y=px . You can verify that this is satisfied when e1/2−λx=px and e1/2−λy=py , giving
quelle