Ist die lateinische Hypercube-Abtastung in mehreren Dimensionen wirksam?

8

Ich verwende derzeit ein Latin Hypercube Sampling (LHS), um weit auseinander liegende einheitliche Zufallszahlen für Monte-Carlo-Verfahren zu generieren. Obwohl die Varianzreduzierung, die ich von LHS erhalte, für eine Dimension ausgezeichnet ist, scheint sie in zwei oder mehr Dimensionen nicht effektiv zu sein. Angesichts der Tatsache, dass LHS eine bekannte Technik zur Varianzreduzierung ist, frage ich mich, ob ich den Algorithmus möglicherweise falsch interpretiere oder auf irgendeine Weise missbrauche.

Insbesondere ist der LHS-Algorithmus, den ich verwende, um beabstandete einheitliche Zufallsvariablen in Dimensionen zu erzeugen : $N$ $D$

Erzeugen Sie für jede Dimension eine Menge von gleichmäßig verteilten Zufallszahlen so dass , ... $D$ $N$ $\{u^1_D,u^2_D...u^N_D\}$ $u^1_D \in [0,\frac{1}{N+1}]$ $u^2_D \in [\frac{1}{N+1}, \frac{2}{N+1}]$ $u^N_D \in [\frac{N}{N+1}, 1]$
Ordnen Sie für jede Dimension die Elemente aus jedem Satz zufällig neu an. Das erste , hergestellt von der LHS ist ein - dimensionaler Vektor das erste Element aus jedem Satz neu geordnet, die zweite enthält , hergestellt von LHS ist ein - dimensionaler Vektor mit dem zweiten Element aus jedem neu geordneten Satz und so weiter ... $D \geq 2$ $U(0,1)^D$ $D$ $U(0,1)^D$ $D$

Ich habe unten einige Diagramme beigefügt, um die Varianzreduzierung zu veranschaulichen, die ich in und für ein Monte-Carlo-Verfahren erhalte . In diesem Fall besteht das Problem darin, den erwarteten Wert einer Kostenfunktion schätzen, wobei und eine dimensionale Zufallsvariable ist, die zwischen . Insbesondere zeigen die Diagramme den Mittelwert und die Standardabweichung von 100 Stichprobenmittelwertschätzungen von für Stichprobengrößen von 1000 bis 10000. $D = 1$ $D = 2$ $E[c(x)]$ $c(x) = \phi(x)$ $x$ $D$ $[-5,5]$ $E[c(x)]$

LHS für $ D = 1 $

LHS für $ D = 2 $

Ich erhalte die gleichen Varianzreduktionsergebnisse, unabhängig davon, ob ich meine eigene Implementierung oder die lhsdesignFunktion in MATLAB verwende. Auch die Varianzreduzierung ändert sich nicht, wenn ich alle Sätze von Zufallszahlen permutiere, anstatt nur diejenigen, die . $D \geq 2$

Die Ergebnisse sind sinnvoll, da eine geschichtete Stichprobe in bedeutet, dass wir von Quadraten anstelle von Quadraten abtasten sollten , die garantiert gut verteilt sind. $D = 2$ $N^2$ $N$

sampling monte-carlo latin-square latin-hypercube Berk U.
quelle

3

Ich habe die in Ihrem Beitrag beschriebenen Probleme in drei Fragen unterteilt. Eine gute Referenz für Ergebnisse zu Latin Hypercube Sampling und anderen Techniken zur Varianzreduzierung ist dieses Buchkapitel . Dieses Buchkapitel enthält auch Informationen zu einigen „Grundlagen“ der Varianzreduzierung.

Q0. Was ist Varianzreduzierung? Bevor Sie auf die Details eingehen, sollten Sie sich daran erinnern, was "Varianzreduzierung" tatsächlich bedeutet. Wie im Kapitel "Grundlagen" erläutert, hat die mit einer Monte-Carlo-Prozedur verbundene Fehlervarianz typischerweise die Form unter IID-Abtastung. Um die Fehlervarianz zu verringern, können wir entweder die Stichprobengröße erhöhen oder einen Weg finden, um zu reduzieren . Die Varianzreduzierung befasst sich mit Möglichkeiten zur Reduzierung von , so dass solche Methoden möglicherweise keinen Einfluss auf die Art und Weise haben, in der sich die Fehlervarianz ändert, wenn variiert. $\sigma^2/n$ $n$ $\sigma$ $\sigma$ $n$

Q1. Wurde Latin Hypercube Sampling korrekt implementiert? Ihre schriftliche Beschreibung erscheint mir korrekt und stimmt mit der Beschreibung im Buchkapitel überein. Mein einziger Kommentar ist, dass die Bereiche der Variablen nicht das gesamte Einheitsintervall zu füllen scheinen; Es scheint, dass Sie tatsächlich benötigen , aber hoffentlich hat sich dieser Fehler nicht in Ihre Implementierung eingeschlichen. Die Tatsache, dass beide Implementierungen ähnliche Ergebnisse lieferten, lässt darauf schließen, dass Ihre Implementierung wahrscheinlich korrekt ist. $u^i_D$ $u^i_D \in [\frac{i-1}{N}, \frac{i}{N}]$

Q2. Stimmen Ihre Ergebnisse mit denen überein, die Sie von LHS erwarten könnten? In Satz 10.4 des Buchkapitels heißt es, dass die LHS-Varianz niemals (viel) schlechter sein kann als die Varianz, die aus der IID-Stichprobe erhalten wird. Oft ist die LHS-Varianz viel geringer als die IID-Varianz. Genauer gesagt besagt Satz 10.1, dass wir für die LHS-Schätzung wobei der 'Rest der Additivität' ist von der Funktion dh minus ihrer besten additiven Näherung (siehe S.10 des Buchkapitels für Details, ist additiv, wenn wir schreiben können $\hat{\mu}_{LHS}=\frac{1}{n} \sum_{i=1}^n f(X_i)$

V a r ({\hat{μ}}_{L H S}) = n^{- 1} \int e (x)^{2} d x + o (n^{- 1})

$\mathrm{Var}(\hat{\mu}_{LHS})=n^{-1}\int e(x)^2dx+o(n^{-1})$

e (x)

$e(x)$

f

$f$

f

$f$

f

$f$

f (x) = μ + \sum_{j = 1}^{D} f_{j} (x_{j})

$f(x)=\mu+\sum_{j=1}^D f_j (x_j)$ ).

Für ist jede Funktion additiv, also und aus Satz 10.1. Tatsächlich entspricht LHS für einer gitterbasierten Schichtung (Abschnitt 10.1 im Buchkapitel), sodass die Varianz tatsächlich (Gleichung 10.2 im Buchkapitel; nimmt an, dass kontinuierlich differenzierbar ist). Dies scheint nicht mit Ihrem ersten Diagramm unvereinbar zu sein. Der Hauptpunkt ist, dass ein ganz besonderer Fall ist! $D=1$ $e=0$ $\mathrm{Var}(\hat{\mu}_{LHS})=o(n^{-1})$ $D=1$ $O(n^{-3})$ $f$ $D=1$

Für ist es wahrscheinlich, dass so dass Sie eine Varianz der Ordnung erwarten können . Auch dies ist nicht inkonsistent mit Ihrem zweiten Diagramm. Die tatsächlich erzielte Varianzreduzierung (im Vergleich zur IID-Stichprobe) hängt davon ab, wie nahe Ihre gewählte Funktion an der Addition liegt. $D=2$ $e\neq 0$ $O(n^{-1})$

Zusammenfassend kann LHS in geringen bis mittleren Dimensionen und insbesondere für Funktionen wirksam sein, die durch additive Funktionen gut angenähert werden.

S. Catterall stellt Monica wieder her
quelle

2

http://statweb.stanford.edu/~owen/mc/Ch-var-adv.pdf

In diesem Artikel wird die Varianzreduzierung der Latin Hypercube Sampling in mehreren Dimensionen erörtert. LHS erzwingt keine Einheitlichkeit beim Abtasten in mehreren Dimensionen, da es einfach in jeder Dimension unabhängig abtastet und dann die Dimensionen zufällig kombiniert. Geschichtete Stichprobe von N ² Bins wie Sie erwähnen ist auch als Orthogonal Sampling bezeichnet als auf der Wikipedia - Seite diskutiert: https://en.wikipedia.org/wiki/Latin_hypercube_sampling und erzwingt mehrdimensionale Gleichförmigkeit durch aus den Behältern der Probenahme stattdessen alle Dimensionen kombiniert.

Mit ein paar Änderungen an dieser Art der Abtastung kann gezeigt werden, dass die Fehlervarianz O (N ^{-1-2 / d} ) ist ( ^siehe Lit. oben). Obwohl dies große Gewinne für kleine Dimensionen liefert, beginnt es in größeren Dimensionen, sich auf die Leistung von gewöhnlichem Monte Carlo zu verschlechtern.

Bscan
quelle

1

Ich möchte "Additivität" kommentieren. LHS stellt z. B. sicher, dass X1 und X2 gut verteilt sind (normalerweise in (0,1)). Wenn also ein Design nur von einer Variablen abhängt, erhalten Sie ein "perfektes" Histogramm und eine starke Varianzreduzierung. Für die Integration von f = 100 * X1 + X2 erhalten Sie ebenfalls gute Ergebnisse, nicht jedoch für X1-X2! Dieser Unterschied hat eine fast zufällige Zufallsverteilung, keine LHS-Eigenschaften. In der Elektronik nutzen Konstruktionen häufig aus, dass sich 2 Parametereinflüsse meistens gegenseitig aufheben (Differenzpaar, Stromspiegel, Replikationsschaltungen usw.), aber der Effekt der Nichtübereinstimmung X1-X2 ist immer noch vorhanden und häufig dominant. Daher verhält sich die LHS-MC-Analyse in vielen elektrischen Konstruktionen nicht besser als die MC.

user32038
quelle

Ich bin mir nicht sicher, was es für , eine "fast iid zufällige Verteilung, keine LHS-Eigenschaften" zu haben. In diesem Fall ist immer noch additiv, sodass Sie mit LHS eine gute Varianzreduzierung erwarten können, genau wie mit der additiven Funktion . Sie können dies durch Simulation überprüfen.

f = X_{1} - X_{2}

$f=X_1-X_2$

f

$f$

f = 100 X_{1} + X_{2}

$f=100X_1+X_2$

S. Catterall stellt Monica

Ist die lateinische Hypercube-Abtastung in mehreren Dimensionen wirksam?

Antworten: