Angenommen, ich möchte aus einer kontinuierlichen Verteilung . Wenn ich einen Ausdruck von in der Form habep
wobei und f_i Verteilungen sind, aus denen leicht abgetastet werden kann, dann kann ich leicht Abtastwerte aus p erzeugen durch:
- Abtasten eines Labels mit der Wahrscheinlichkeit
- Abtastung
Ist es möglich, diese Prozedur zu verallgemeinern, wenn die gelegentlich negativ sind? Ich vermute, ich habe dies irgendwo gesehen - möglicherweise in einem Buch, möglicherweise für die Kolmogorov-Distribution -, daher würde ich gerne eine Referenz als Antwort akzeptieren.
Wenn ein konkretes Spielzeug Beispiel nützlich ist, sagen wir , ich auf Probe möchten
Im Prinzip könnte ich dies dann als folgende Summe erweitern:
Die -Terms innerhalb der Summe können dann unabhängig voneinander als Gamma-Zufallsvariablen abgetastet werden. Mein Problem ist offensichtlich, dass die Koeffizienten "gelegentlich" negativ sind.
Bearbeiten 1 : Ich stelle klar, dass ich aus p exakte Stichproben generieren möchte , anstatt die Erwartungen unter p zu berechnen . Für Interessenten wird in den Kommentaren auf einige Verfahren hingewiesen.
Edit 2 : Ich habe die Referenz, die einen bestimmten Ansatz für dieses Problem enthält, in Devroyes 'Non-Uniform Random Variate Generation' gefunden . Der Algorithmus stammt aus 'A Note on Sampling from Combinations of Distributions' von Bignami und de Matteis . Das Verfahren besteht effektiv darin, die Dichte von oben durch die positiven Terme der Summe zu begrenzen und dann eine Ablehnungsabtastung basierend auf dieser Hüllkurve zu verwenden. Dies entspricht der in der Antwort von @ Xi'an beschriebenen Methode.
Antworten:
Ich habe über diese Frage gerätselt, aber nie eine zufriedenstellende Lösung gefunden.
Eine mögliche Eigenschaft ist, dass wenn eine Dichte schreibt, wobei ist Dichte, so dass , Simulation von und Zurückweisen dieser Simulationen mit der Wahrscheinlichkeit Simulationen von liefert . Im aktuellen Fall ist die normalisierte Version der positiven Gewichtskomponenten und ist der Rest
Ein erster rechnerischer Nachteil dieses Ansatzes besteht darin, dass trotz der ersten Simulation aus einer ausgewählten Komponente die Summen in und für den Zurückweisungsschritt berechnet werden müssen. Wenn die Summen ohne geschlossene Form unendlich sind, kann die Methode "Akzeptieren / Ablehnen" nicht implementiert werden .fi g h
Eine zweite Schwierigkeit besteht darin, dass die Ablehnungsrate ist, da beide Gewichtssummen in derselben Reihenfolge sindhat keine Obergrenze. Wenn die mit verknüpfte Reihe nicht absolut konvergiert, ist die Akzeptanzwahrscheinlichkeit tatsächlich Null! Und die Methode kann in dieser Situation nicht implementiert werden.
Wenn im Fall einer Mischungsdarstellung geschrieben werden kann als Die Komponente kann zuerst ausgewählt und dann die auf die Komponente angewendete Methode. Dies kann jedoch schwierig zu implementieren sein, da die Identifizierung von Paaren , die zu passen, aus der möglicherweise unendlichen Summe nicht unbedingt machbar ist.f
Ich denke, eine effizientere Auflösung könnte von der Seriendarstellung selbst kommen. Devroye, Uneinheitliche Erzeugung zufälliger Variablen , Abschnitt IV.5, enthält eine Vielzahl von Serienmethoden. Wie zum Beispiel der folgende Algorithmus für eine alternative Seriendarstellung des Ziels wenn ' s konvergieren mit gegen Null und ist eine Dichte:
Das Problem wurde kürzlich im Zusammenhang mit dem Debiasing von voreingenommenen Schätzern für MCMC betrachtet, wie beispielsweise beim Glynn-Rhee-Ansatz . Und der russische Roulette- Schätzer (mit einem Zusammenhang mit dem Bernoulli-Fabrikproblem). Und die unvoreingenommene MCMC-Methodik . Aber es gibt kein Entkommen vor dem Vorzeichenproblem ... Dies macht seine Verwendung bei der Schätzung von Dichten wie bei pseudo-marginalen Methoden schwierig.
quelle
Ich habe den Entwurf einer Idee, die funktionieren könnte. Es ist nicht genau , aber hoffentlich asymptotisch genau. Um daraus eine wirklich strenge Methode zu machen, bei der die Annäherung kontrolliert wird oder etwas daran bewiesen werden kann, ist wahrscheinlich viel Arbeit erforderlich.
Erstens können Sie, wie von Xi'an erwähnt, die positiven Gewichte einerseits und die negativen Gewichte andererseits gruppieren, so dass das Problem schließlich nur zwei Verteilungen und :g h
mit . Beachten Sie, dass Sie .λ−μ=1 λ≥1
Meine Idee ist die folgende. Sie möchten Beispiel Beobachtungen von . Machen:N p
Am Ende erhalten Sie Punkte. Es muss nicht genau der nächste Nachbar sein, sondern nur ein Punkt, der "nah genug" ist. Der erste Schritt ist wie das Erzeugen von Materie. Der zweite Schritt ist wie die Erzeugung von Antimaterie und deren Kollision und Aufhebung mit Materie. Diese Methode ist nicht genau, aber ich glaube, unter bestimmten Bedingungen ist sie für großes asymptotisch genau (um sie für kleines fast genau zu machen, müssen Sie zuerst ein großes und dann einen kleinen zufälligen Teil der endgültigen Liste nehmen). . Ich gebe ein sehr informelles Argument, das eher eine Erklärung als ein Beweis ist.(λ−μ)N=N N n N
Betrachten Sie im Beobachtungsraum und ein kleines Volumen um mit Lebesgue-Volumen . Nach dem Abtasten von beträgt die Anzahl der Elemente in der Liste, die sich ebenfalls in befinden, ungefähr . Nach dem zweiten Schritt wird ungefähr daraus entfernt, und Sie haben ungefähr die gewünschte Anzahl . Dazu müssen Sie davon ausgehen, dass die Anzahl der Punkte im Volumen ausreichend groß ist.x v x ϵ g v λNg(x)ϵ μNh(x)ϵ Np(x)ϵ
Es ist sehr unwahrscheinlich, dass dieses Verfahren einer großen Dimension oder einigen Pathologien von und widersteht, es kann jedoch in einer kleinen Dimension und ausreichend glatten, "ausreichend gleichmäßigen" Verteilungen arbeiten.g h
Hinweis zu einer genauen Methode:
Ich habe dies zuerst für diskrete Verteilungen gedacht, und in diesem Fall ist die Methode eindeutig nicht genau, da sie Stichproben mit der Wahrscheinlichkeit 0 erzeugen kann. Ich habe die starke Intuition, dass eine genaue Methode mit endlicher Verarbeitungszeit nicht möglich ist und dass dies der Fall ist Unmöglichkeit konnte zumindest für diskrete Verteilungen nachgewiesen werden. Die Regel des Spiels ist, dass Sie nur exakte "Orakel" -Sampler für und aber und als Funktionen von . Der Einfachheit halber beschränken Sie sich auf Bernoulli-Verteilungen. Die Nichtexistenz einer exakten Methode hängt mit der Bernoulli-Factory- Theorie zusammen: Wenn Sie aus einem eine -Münze erstellen könnteng h g h x (λp−μq) p -coin und eine -coin, dann könnten Sie eine -coin aus einer -coin erstellen, von der bekannt ist, dass sie für unmöglich ist .q λp p λ>1
quelle