Ergebnisse zu Monte-Carlo-Schätzungen, die anhand von Stichproben ermittelt wurden

13

Ich habe im letzten Jahr ziemlich genau an der Stichprobe der Wichtigkeit gearbeitet und habe ein paar offene Fragen, bei denen ich gehofft hatte, Hilfe zu bekommen.

Meine praktische Erfahrung mit Stichprobenverfahren von Bedeutung war, dass sie gelegentlich fantastische Schätzungen mit niedriger Varianz und niedriger Verzerrung liefern können. Häufiger neigen sie jedoch dazu, Schätzungen mit hohem Fehler zu erzeugen, die eine geringe Stichprobenvarianz, aber eine sehr hohe Verzerrung aufweisen.

Ich frage mich, ob jemand genau erklären kann, welche Arten von Faktoren die Gültigkeit von Stichprobenschätzungen von Bedeutung beeinflussen. Insbesondere frage ich mich:

1) Konvergieren Schätzungen der Wichtigkeitsstichproben garantiert zum richtigen Ergebnis, wenn die Vorspannungsverteilung die gleiche Unterstützung wie die ursprüngliche Verteilung aufweist? Wenn ja, warum scheint dies in der Praxis so lange zu dauern?

2) Gibt es eine quantifizierbare Beziehung zwischen dem Fehler in einer Schätzung, die durch Stichprobenerhebung von Bedeutung erstellt wurde, und der "Qualität" der Vorspannungsverteilung (dh wie weit sie mit der Null-Varianz-Verteilung übereinstimmt)

3) Teilweise basierend auf 1) und 2) - Gibt es eine Möglichkeit zu quantifizieren, wie viel Sie über eine Verteilung wissen müssen, bevor Sie mit einem Stichprobendesign von Bedeutung besser dran waren als mit einer einfachen Monte-Carlo-Methode?

Berk U.
quelle

Antworten:

8

Wichtige Stichproben haben genau die gleiche Validierung wie der grundlegende Monte-Carlo-Ansatz. Im Kern handelt es sich um einfaches Monte Carlo . In der Tat handelt es sich lediglich um eine Änderung des Referenzmaßes von nach Somit ist die Konvergenz in beiden Fällen durch das Gesetz der großen Zahlen gewährleistet, dh ob Sie aus oder aus simulieren . Wenn außerdem der Term endlich ist, gilt auch der zentrale Grenzwertsatz und die Konvergenzgeschwindigkeit ist h ( x ) f ( x )

h(x)f(x)dx
fgh2(x)f2(x)
h(x)f(x)G(x)G(x)dx
fGO(1/
h2(x)f2(x)G(x)dx
O(1/Ö(1/n). Wenn es "in der Praxis so lange dauert", kann der obige Varianzfaktor in der CLT ziemlich groß sein. Aber, und ich bestehe darauf, die Geschwindigkeit ist die gleiche wie bei normalem Monte Carlo, .Ö(1/n)

Die Qualität einer Wichtigkeitsabtastungsverteilung steht somit in direktem Zusammenhang mit dem obigen Varianzfaktor, der für die "Null-Varianzverteilung" proportional zu auf Null geht .|h(x)|f(x)

Xi'an
quelle
2
Angesichts der Tatsache, dass das OP Schätzer für geringe Varianz angibt, die voreingenommen sind, aber eine geringe Varianz zu haben scheinen, vermute ich, dass er möglicherweise nach einer Stichprobe von selbstnormalisierter Bedeutung fragt. Ein gutes Beispiel finden Sie in Radford Neals Rant über den Harmonic Mean Estimator , der eine Stichprobenschätzung mit einer Varianz von 0 annimmt und Unsinn zurückgibt. Ich bin nicht sicher, ob dies jemals bei Stichproben von regelmäßiger Bedeutung vorkommt, aber es ist sicherlich selten.
Deinst
Selbst wenn dies nicht die Absicht des OP wäre, würde ich mich für einige Hinweise interessieren, wie ich herausfinden kann, wann die Selbstnormalisierung schrecklich schief gehen wird.
Deinst
@deinst Ich war mir des Selbstnormalisierungsverfahrens und seiner Fallstricke nicht bewusst. Vielen Dank dafür! In jedem Fall denke ich, dass die Probleme für die Eigenschaften meines IS-Schemas relevant sein können, deshalb möchte ich diese Idee noch etwas näher untersuchen, wenn jemand von Ihnen Ideen hat.
Berk U.
@deinst Das IS-Schema, das ich verwende, ist so konzipiert, dass es ohne die vorliegende Stichprobenverteilung funktioniert . Das Schema verwendet zuerst eine MCMC-Prozedur, um Punkte aus der Null-Varianz-Verteilung zu simulieren . Als nächstes wird die Kernel- für , um zu erzeugen . Mit in der Hand kann ich dann neue Punkte aus meiner IS-Schätzung als $ \ sum {h (y_i) f (y_i) / hat {g (y_i)} $ abtasteng(x)x 1 . . x M g ( x ) = h ( x ) f ( x ) /h ( x ) f ( x ) d x x 1 . . x M ^ g ( x ) ^ g ( x ) N y 1 . . . y NMx1..xMg(x)=h(x)f(x)/h(x)f(x)dxx1..xMg(x)^g(x)^Ny1...yN
Berk U.
Die Verwendung einer nichtparametrischen Schätzung führt zu einer Variabilität höherer Ordnung als die Monte-Carlo-Variabilität, daher würde ich davon abraten.
Xi'an
7

Xi'an hat die Stichprobenergebnisse von Standardbedeutung abgedeckt. Wenn Sie nach einer Stichprobe mit selbstnormalisierter Wichtigkeit fragen, bei der Sie nur und bis zu einer unbekannten Normalisierungskonstante kennen, werden einige Techniken in Kapitel 4 der statistischen Methoden von Monte Carlo und Introducing Monte sowohl in Xi'an als auch in Casella erörtert Carlo - Methoden mit R . Ich bin mir sicher, dass Xi'an dies viel detaillierter ausführen kann als ich. In gewissem Sinne ist diese Antwort ein Bärenköder.gfg

Mit der selbstnormalisierten Wichtigkeitsabtastung versuchen Sie, zu approximieren, indem Sie aus einer Verteilung auswählen deren Dichtefunktion proportional zu und Berechnen von Unter Verwendung der Delta-Methode (im Grunde genommen unter Berücksichtigung der linearen Terme der Taylor-Reihe von ) und unter Berücksichtigung von wir und x 1 , ... , x n g ( x ) , δ = Σ n i = 1 h ( x ) f ( x ) / g ( x )

δ=h(x)f(x)dx
x1,,xng(x)X/Yω(X)=f(x)/g(X)Eg( δ )δ+δVarg(ω(X))-Covg(ω(X),h(
δ^=i=1nh(x)f(x)/g(x)i=1nf(x)/g(x).
X/Yω(X)=f(x)/g(X)
Eg(δ^)δ+δVarg(ω(X))Covg(ω(X),h(X)ω(X))n
VarG(δ^)VarG(h(X)ω(X))-2δCovG(ω(X),h(X)ω(X))+δ2VarG(ω(X))n.

Um eine geringe Verzerrung und Varianz zu erhalten, möchten Sie intuitiv, dass klein und positiv zu sein. Leider sind diese Näherungen nicht perfekt (und die genaue Bestimmung der Varianzen und Kovarianzen ist wahrscheinlich genauso schwierig wie die Lösung des ursprünglichen Problems).VarG(ω(X))CovG(ω(X),h(X)ω(X))

deinst
quelle
Danke dafür. Ich bin mir nur ein bisschen unsicher, ob es einen Tippfehler gibt. Was genau bedeuten und in Ihrer Erklärung? X/Y.G
Berk U.
@BerkUstun Die Hauptstadt G ist ein Tippfehler für eine kleine, die ich umgehend beheben werde. X / Y ist nur ein allgemeines Verhältnis von Zufallsvariablen. IIRC all dies wird in Lius Monte-Carlo-Buch (etwas mit wissenschaftlichem Titel) erklärt
deinst
@deinst: Toller Punkt! Tatsächlich unterscheiden sich die Eigenschaften der selbstnormierten Versionen erheblich von denen des unverzerrten Stichprobenschätzers. Theoretisch würde man einen separaten Wichtigkeits-Sampler benötigen, um den Nenner zu schätzen.
Xi'an,