Monte-Carlo-Integration für nicht quadratisch integrierbare Funktionen

9

Ich hoffe, dies ist der richtige Ort, um zu fragen, ob Sie es nicht in ein geeigneteres Forum verschieben können.

Ich habe mich schon eine ganze Weile gefragt, wie man nicht quadratisch integrierbare Funktionen mit Monte Carlo Integration behandelt. Ich weiß, dass MC immer noch eine korrekte Schätzung liefert, aber der Fehler ist für diese Art von Funktionen nicht erreichbar (divergent?).

Beschränken wir uns auf eine Dimension. Monte-Carlo-Integration bedeutet, dass wir das Integral approximieren

I=01dxf(x)

unter Verwendung der Schätzung

E=1Ni=1Nf(xi)

mit gleichmäßig verteilten Zufallspunkten. Das Gesetz der großen Zahlen stellt sicher , dass . Die StichprobenvarianzE I.xi[0,1]EI

S2=1N1i=1N(f(xi)E)2

approximiert die Varianz der durch induzierten Verteilung . Wenn jedoch nicht quadratintegrierbar ist, dh das Integral der quadratischen Funktion divergiert, impliziert dies f fσ2ff

σ2=01dx(f(x)I)2=01dxf2(x)I2

was bedeutet, dass auch die Varianz divergiert.

Ein einfaches Beispiel ist die Funktion

f(x)=1x

für die und .σ2=10dxI=01dx1x=2σ2=01dx(1x2)=[lnx2x]01

Wenn endlich ist, kann man den Fehler des Mittelwerts durch approximieren , aber was ist, wenn ist nicht quadratintegrierbar? E S.σ2E f(x)SNσNf(x)

cschwan
quelle
1
Ich verstehe es nicht: Sie beginnen mit der Feststellung, dass keines der eine Varianz hat, und fragen dann, ob die Varianz ihres Durchschnitts ein vernünftiger Schätzer für - diese nicht existierende Varianz wäre! Oder verstehe ich diese Frage falsch: Vielleicht haben Sie durch "statistisch unabhängige Schätzungen" einen anderen (vielleicht robusten) Schätzer für das Integral im Sinn? Ei
whuber
Ich habe nicht gesagt nicht eine Abweichung hat, nur , dass ich nicht kann definieren eine Varianz für sie durch . Die Frage ist also , ob ich einen Fehler definieren kann überhaupt und wenn ist ein vernünftiger Kandidat. Mit statistisch unabhängig meine ich, dass die mit unterschiedlichen Zufallszahlen erhalten werden, z. B. mit unterschiedlich gesetzten Zufallszahlengeneratoren (ich hoffe, das ist dann der richtige Begriff). S 2 ˉ S 2 E iES2S¯2Ei
Schwan
Bitte erklären Sie, was Sie damit meinen, dass Sie nicht in der Lage sind, "eine Varianz dafür durch zu definieren ". Ich kann dies anhand der Standarddefinitionen von Varianz und nicht verstehen . S 2S2S2
whuber
Nun, ist die Funktion nicht quadratisch integrierbare so, wenn ich mich nicht täusche, sollte abweichen . Wenn dies der Fall ist, macht die Definition für keinen Sinn, oder? Mit Hilfe des zentralen Grenzwertsatzes konvergiert jedoch immer noch zum wahren Wert des Integrals, aber ohne Fehler macht dieser Wert allein keinen Sinn (wie 'gut' ist dieses Ergebnis?). S 2 E.S2S2E
Schwan
Entschuldigung, ich wollte natürlich "Gesetz der großen Zahlen" sagen, nicht CLT.
Schwan

Antworten:

2

Sie können auch andere Skalen- / Dispersionsmaße wie den Interquantilbereich verwenden, die nicht von der Schwanzasymptotik und damit der quadratischen Integrierbarkeit betroffen sind. Mit dem zusätzlichen Vorteil, dass sie im Allgemeinen sowieso sowieso robuster sind.

Offensichtlich soll man sie auf ein Resampling / Bootstrap gefolgt vom Mittelwertschätzer anwenden, nicht direkt auf die Rohausgabe der MC-Abtastung der Funktion vor der Mittelwertbildung. Sie können auch allgemeine L-Schätzer einchecken und einen von ihnen anpassen, um diese beiden Schritte für die Leistung zu einem zusammenzuführen. Die beiden Verteilungen dürfen jedoch mental nicht verwechselt werden, obwohl das Schätzer-PDF natürlich einige Merkmale erbt (einschließlich möglicherweise fehlender Quadrate) Integrierbarkeit).

Quarz
quelle
+1, ich sollte hinzufügen, dass das Gesetz der großen Zahlen keine zweiten Momente erfordert, daher ist dies ein perfekter Rat.
mpiktas
Danke für deine Antwort! Ich muss zugeben, dass ich diese Begriffe zum ersten Mal gelesen habe, aber wenn ich sie bei WP nachgeschlagen habe, denke ich, dass Ihre Antwort mich in die richtige Richtung weist. Könnten Sie oder jemand anderes Artikel oder Bücher vorschlagen, in denen die Themen ausführlicher erläutert werden?
Schwan
Ich merke jetzt, dass meine Antwort vielleicht etwas unklar war. Da Sie Sie simulieren wirklich nicht brauchen Resampling / Bootstrapping, in der Theorie könnten Sie einfach weiter neue Samples hinzufügen statt und erhalten eine empirische Verteilung für die mittlere Schätzer. Nur wenn Ressourcen ein Problem darstellen, können Sie Teilmittelwerte vorberechnen und neu abtasten, aber die Statistiken sind nicht trivial, wenn sie gut gemacht sind. Ich bin kein Boostrap-Experte, daher überlasse ich anderen Ratschläge. Ich wollte nur darauf hinweisen, wenn Sie über die einfache Formulierung hinausgehen müssen. Konzentrieren Sie sich zuerst auf Dispersionsmaßnahmen und optimieren Sie später.
Quarz
Der vorgeschlagene Mittelwertschätzer hat keine endliche Varianz. Es spielt keine Rolle, ob man weitere Stichproben hinzufügt, die empirische Verteilung des Schätzers wird AUCH eine nicht endliche Varianz haben. Sie können dies mit einigen Simulationen bestätigen.
Rajb245
1
Sicher, genau das wurde diskutiert und der Grund, warum man ein anderes Dispersionsmaß verwenden soll.
Quarz