Eine Möglichkeit besteht darin, die Eigenschaften der Kullback-Leibler-Divergenz zu nutzen .
Sei die Familie der Verteilungen mit den gegebenen Rändern und sei Q die Produktverteilung (und offensichtlich Q ∈ P ).P.Q.Q ∈ P.
Für jedes lautet die Kreuzentropie:P.∈P.
H.( P., Q. ) = E.P.[ logq( X.) ] = E.P.[log∏ichqich(X.) ] = ∑ichE.P.[logqich(X.) ] = ∑ichH.( P.ich,Q.ich)
das heißt, die Summe der Kreuzentropie der Ränder. Da alle Ränder festgelegt sind, muss dieser Begriff selbst festgelegt werden.
Jetzt können wir die KL-Divergenz wie folgt schreiben:
D.K.L.(P.∥ Q ) = H.(P., Q ) - H.(P.)
und daher:
a rgm i nP.∈ P. D.K.L.(P.∥ Q ) = a r gm a xP.∈ P. H.(P.)
das heißt, die Verteilung , die die Entropie maximiert, ist diejenige, die die KL-Divergenz mit minimiert , von der wir aufgrund der Eigenschaften der KL-Divergenz wissen, dass sie selbst ist.Q Q.P.Q.Q.