Verwendung von MCMC zur Bewertung des erwarteten Werts einer hochdimensionalen Funktion

10

Ich arbeite an einem Forschungsprojekt, das sich auf Optimierung bezieht, und hatte kürzlich die Idee, MCMC in dieser Umgebung einzusetzen. Leider bin ich ziemlich neu in MCMC-Methoden, daher hatte ich mehrere Fragen. Ich beschreibe zunächst das Problem und stelle dann meine Fragen.

Unser Problem besteht darin, den erwarteten Wert einer Kostenfunktion wobei eine dimensionale Zufallsvariable mit einer Dichte .ω = ( ω 1 , & ohgr; 2 , . . . ω h ) h f ( ω )c(ω)ω=(ω1,ω2,...ωh)hf(ω)

In unserem Fall existiert keine geschlossene Version von . Dies bedeutet, dass wir Monte-Carlo-Methoden verwenden müssen, um den erwarteten Wert zu approximieren. Leider stellt sich heraus, dass Schätzungen von , die mit MC- oder QMC-Methoden generiert werden, zu viel Varianz aufweisen, um in einer praktischen Umgebung nützlich zu sein.E [ c ( ω ) ]c(ω)E[c(ω)]

Eine Idee, dass wir eine wichtige Stichprobenverteilung verwenden mussten, um Stichprobenpunkte zu generieren, die eine Schätzung der geringen Varianz von . In unserem Fall muss die Stichprobenverteilung idealer Bedeutung ungefähr proportional zu . Angesichts der Tatsache, dass bis zur Konstanten bekannt ist, frage ich mich, ob ich MCMC zusammen mit der Angebotsverteilung um schließlich Stichproben aus zu generieren .g ( ω ) c ( ω ) f ( ω ) g ( ω ) c ( ω ) f ( ω )E[c(ω)]g(ω)c(ω)f(ω)g(ω)c(ω)f(ω)g(ω)

Meine Fragen hier sind:

  • Kann MCMC in dieser Einstellung verwendet werden? Wenn ja, welche MCMC-Methode wäre angemessen? Ich arbeite in MATLAB, daher bevorzuge ich alles, was bereits eine MATLAB-Implementierung hat.

  • Gibt es Techniken, mit denen ich die Einbrennzeit für MCMC beschleunigen kann? Und wie kann ich feststellen, dass die stationäre Verteilung erreicht wurde? In diesem Fall dauert die Berechnung von für ein bestimmtes tatsächlich .ωc(ω)ω

Berk U.
quelle
Tippfehler im letzten Absatz? statt ? c ( w )C(w)c(w)
mpiktas
Sie müssen nicht haben nur Monte - Carlo - Methoden für hochdimensionale Integrale zu verwenden , da eine geschlossene Form nicht existiert. Sie können Methoden verwenden, die auf spärlichen Gittern basieren . Ich kenne die Vor- und Nachteile selbst nicht.
Onestop
@onestop - Sie haben Recht, spärliche Gitter funktionieren in meinem Fall etwas besser, obwohl ich diese Idee auch gerne testen möchte.
Berk U.
Es klingt ein bisschen nach Finanzen.
Wok
1
Es könnte zur Finanzierung angewendet werden. Wir verwenden es jedoch für die optimale Verwaltung von Stromversorgungssystemen :)
Berk U.

Antworten:

4

Ich würde mich immer daran erinnern, dass MCMC nur ein numerisches Integrationswerkzeug ist (und ein ziemlich ineffizientes). Es ist keine magische / mystische Sache. Es ist sehr nützlich, weil es relativ einfach anzuwenden ist. Im Vergleich zu einigen anderen numerischen Integrationstechniken erfordert es nicht viel Nachdenken. Zum Beispiel müssen Sie keine Derivate machen. Sie müssen nur "Zufallszahlen" generieren.

Wie jede numerische Integrationsmethode ist sie jedoch kein universelles Catch-All-Tool. Es gibt Bedingungen, unter denen es nützlich ist, und Bedingungen, unter denen es nicht nützlich ist.

Es kann klüger sein, eine andere Technik einzurichten. Abhängig davon, wie groß ist, wie schnell Ihr Computer ist und wie viel Zeit Sie bereit sind, auf Ergebnisse zu warten. Ein einheitliches Raster kann die Arbeit erledigen (obwohl dies ein kleines h oder eine lange Wartezeit erfordert ). Die "Aufgabe" besteht darin, das Integral zu bewerten - der Gleichung ist es egal, welche Bedeutung Sie oder ich dem Ergebnis beimessen (und daher ist es egal, ob wir das Ergebnis zufällig erhalten haben oder nicht).hh

Wenn Ihre Schätzungen von ziemlich genau sind, wird f ( ω ) außerdem einen scharfen Peak aufweisen und einer Delta-Funktion sehr ähnlich sein, sodass das Integral effektiv ω ω m a x ersetzt .ωf(ω)ωωmax

f(ω)f(ωmax)+(ωωmax)f(ωmax)+12(ωωmax)2f(ωmax)+

Dies ist eine nützliche Strategie, wenn die Momente von leicht zu erhalten sind.ω

Edwin Jaynes hat ein schönes Zitat dazu:

Wenn es eine zufällige Art gibt, etwas zu tun, gibt es eine nicht zufällige Art, die bessere Ergebnisse liefert, aber mehr Nachdenken erfordert

Ein "mehr denkender" Weg ist die Verwendung von "geschichtetem MCMC", um das Integral zu erstellen. Wählen Sie also nicht "zufällig" einen Punkt im gesamten Parameterraum aus: Teilen Sie ihn in "Schichten" auf. Diese "Schichten" sollten so ausgewählt werden, dass Sie einen guten Bereich des hohen Teils des Integrals erhalten. Dann zufällige Stichprobe innerhalb jeder Schicht. Dafür müssen Sie jedoch Ihren eigenen Code schreiben, den ich mir vorstellen würde (dh mehr nachdenken).

Wahrscheinlichkeitslogik
quelle
Vielen Dank für Ihren Beitrag. Ich mag Ihre geschichtete MC-Idee sehr. Ich habe mich gefragt, ob Sie über Ressourcen Bescheid wissen, damit ich mich darüber informieren kann. Alles, was ein Beispiel in Aktion hat, wäre sehr dankbar.
Berk U.
Dies ist eine Idee, die ich hatte, daher kenne ich keine Ressourcen. Es könnte in das MCMC-Framework eingefügt werden, indem eine weitere Ebene hinzugefügt wird, die die Schichten definiert. Und eine meiner Hauptschwächen ist es, Dinge zu tun - ich bin im Herzen ein Denker! Ich weiß, das hilft dir nicht sehr und ich entschuldige mich dafür. Aber ich bin sicherlich nicht die einzige Person, die daran gedacht hat. Jeder, der "designbasierte" Statistiken und "Bayesianische Statistiken" erstellt hat, hätte sicherlich daran gedacht.
Wahrscheinlichkeitslogik
2

Es gibt keinen Hinweis darauf, dass Ihre Variablen hier korreliert sind, daher weiß ich nicht, warum Sie MCMC im Gegensatz zu regulärem Monte Carlo verwenden würden. Es gibt viele verschiedene Stichprobenverfahren, einschließlich der genannten geschichteten Stichproben (Latin Hypercube) und QMC. Spärliche Quadraturmethoden sind sehr gut, wenn die Dimension des Problems nicht zu hoch ist (nicht mehr als 10), da spärliche Quadraturgitter geometrisch wachsen (Fluch der Dimensionalität).

Aber es hört sich so an, als wären Sie in Bezug auf die Wichtigkeitsabtastung auf dem richtigen Weg. Der Schlüssel hier ist, eine voreingenommene Verteilung zu wählen, deren Wahrscheinlichkeit sich in der Nähe Ihrer interessierenden Region konzentriert und deren Schwanz dicker ist als die nominelle Verteilung.

Ich möchte hinzufügen, dass dies ein offenes Forschungsproblem ist. Wenn Sie also etwas Gutes finden können, wäre es für die Community von großem Interesse!

Gary
quelle
Danke dafür! Könnten Sie etwas mehr über die Beziehung zwischen der Wirksamkeit von MCMC und der Korrelation zwischen den Variablen herausfinden? Ich hatte immer gedacht, dass MCMC einen Vorteil gegenüber bestehenden numerischen Integrationstechniken bieten würde, wenn die Variablen korreliert sind - obwohl ich keinen guten Grund dafür liefern kann.
Berk U.
0

g(ω)

Darüber hinaus möchten Sie möglicherweise nach Techniken zur Varianzreduzierung im Bereich der MC-Integration suchen. Eine große Auswahl an Ressourcen sind die kostenlosen Buchkapitel von Art Owen in Stanford. Insbesondere die Kapitel 8, 9 und 10.

Dort finden Sie eingehende Behandlungen der adaptiven Abtastung, Rekursion und anderer Techniken.

JKnight
quelle