Ich habe Probleme, die KL-Divergenzformel unter der Annahme von zwei multivariaten Normalverteilungen abzuleiten. Ich habe den univariaten Fall ziemlich leicht gemacht. Es ist jedoch eine Weile her, dass ich Mathe-Statistiken erstellt habe, und daher habe ich einige Probleme, diese auf den multivariaten Fall auszudehnen. Ich bin mir sicher, ich vermisse nur etwas Einfaches.
Folgendes habe ich ...
Angenommen, sowohl als auch sind die pdfs der Normalverteilungen mit den Mitteln und bzw. den Varianzen und . Der Kullback-Leibler-Abstand von zu ist:
, was für zwei multivariate Normalen gilt:
Nach der gleichen Logik wie dieser Beweis komme ich hierher, bevor ich stecke:
Ich glaube, ich muss den Trace-Trick implementieren , bin mir aber nicht sicher, was ich danach tun soll. Alle hilfreichen Tipps, um mich wieder auf den richtigen Weg zu bringen, wären willkommen!
Antworten:
Angefangen von dem Punkt, an dem Sie mit einigen geringfügigen Korrekturen begonnen haben, können wir schreiben
Beachten Sie, dass ich einige Eigenschaften aus Abschnitt 8.2 des Matrix-Kochbuchs verwendet habe .
quelle