Angenommen, wir haben eine Menge von Punkten . Jeder Punkt wird unter Verwendung der Verteilung p ( y i | x ) = 1 erzeugt
Um posterior für, schreiben wir
Nach Minkas Artikel überExpectation Propagationbenötigen wirBerechnungen, um posterior zu erhalten und somit wird das Problem für große Stichprobengrößen lösbar. Ich kann jedoch nicht herausfinden, warum wir in diesem Fall so viele Berechnungen benötigen, da für single Wahrscheinlichkeit die Form
Unter Verwendung dieser Formel erhalten wir posterior durch einfache Multiplikation von , so dass wir nur N Operationen benötigen und dieses Problem für große Stichprobengrößen genau lösen können.
Ich mache ein numerisches Experiment, um zu vergleichen, erhalte ich wirklich den gleichen Posterior, wenn ich jeden Term separat berechne und wenn ich das Produkt der Dichten für jedes . Hintere sind gleich. Siehe Wo irre ich mich? Kann mir jemand klar machen, warum wir 2 N- Operationen benötigen , um den posterioren Wert für gegebenes x und gegebenes y zu berechnen ?
Antworten:
Sie haben Recht, dass die Zeitung das Falsche sagt. Sie können die posteriore Verteilung von an einer bekannten Stelle mit O ( n ) -Operationen auswerten . Das Problem ist, wenn Sie Momente des Seitenzahns berechnen möchten. Um das hintere Mittel von x genau zu berechnen , würden Sie 2 N Operationen benötigen . Dies ist das Problem, das das Papier zu lösen versucht.x O(n) x 2N
quelle
Sie haben den Punkt übersehen, dass die Verteilung eine Mischung von Gaußschen ist: Jede Stichprobe wird entweder nach p ( y i | x ) mit der Wahrscheinlichkeit 1 - w und nach p c ( y ) (Störungsverteilung für y , unabhängig von x) verteilt ) mit Wahrscheinlichkeit w .yi p(yi|x) 1−w pc(y) y x w
Sei die Indikatorvariable, die angibt, dass die Probe i aus der Störverteilung gezogen wurde; Wenn es also 0 ist, bedeutet dies, dass die Stichprobe aus p ( y | x ) gezogen wurde . Wenn die Stichprobe aus der Störfleckverteilung gezogen wurde, ist ihr Wert offensichtlich für die Schätzung von x irrelevant .ci i 0 p(y|x) x
Es ist das Vorhandensein der möglichen gemeinsamen Zustände für diese Indikatorvariablen, die das Problem verursachen.2N
quelle