Entspricht die Abtastung aus einer gefalteten Normalverteilung der Abtastung aus einer bei 0 abgeschnittenen Normalverteilung?

9

Ich möchte aus einer normalen Dichte simulieren (sagen wir Mittelwert = 1, sd = 1), möchte aber nur positive Werte.

Eine Möglichkeit besteht darin, von einer Normalen zu simulieren und den absoluten Wert zu nehmen. Ich halte das für eine gefaltete Normalität.

Ich sehe in R gibt es Funktionen für die Erzeugung abgeschnittener Zufallsvariablen. Wenn ich von einer abgeschnittenen Normalen simuliere (Abschneiden bei 0), entspricht dies dem gefalteten Ansatz?

Tal
quelle

Antworten:

10

Ja, die Ansätze liefern die gleichen Ergebnisse für eine Normalverteilung mit dem Mittelwert Null .

Es genügt zu überprüfen, ob die Wahrscheinlichkeiten in Intervallen übereinstimmen, da diese die Sigma-Algebra aller (Lebesgue) messbaren Mengen erzeugen. Sei die Standardnormaldichte: gibt die Wahrscheinlichkeit an, dass eine Standardnormalvariable im Intervall . Dann ist für die abgeschnittene Wahrscheinlichkeit istΦΦ((a,b])(a,b]0ab

Φtruncated((a,b])=Φ((a,b])/Φ([0,])=2Φ((a,b])

(weil ) und die gefaltete Wahrscheinlichkeit istΦ([0,])=1/2

Φfolded((a,b])=Φ((a,b])+Φ([b,a))=2Φ((a,b])

aufgrund der Symmetrie von etwa .Φ0

Diese Analyse gilt für jede Verteilung, die um symmetrisch ist und eine Wahrscheinlichkeit von Null hat, . Wenn der Mittelwert jedoch ungleich Null ist , ist die Verteilung nicht symmetrisch und die beiden Ansätze liefern nicht das gleiche Ergebnis, wie die gleichen Berechnungen zeigen.00

Drei Distributionen

Dieses Diagramm zeigt die Wahrscheinlichkeitsdichtefunktionen für eine Normalverteilung (1,1) (gelb), eine gefaltete Normalverteilung (1,1) (rot) und eine abgeschnittene Normalverteilung (1,1) (blau). Beachten Sie, dass die gefaltete Verteilung die charakteristische Glockenkurvenform nicht mit den beiden anderen teilt. Die blaue Kurve (abgeschnittene Verteilung) ist der positive Teil der gelben Kurve, skaliert auf Flächeneinheit, während die rote Kurve (gefaltete Verteilung) die Summe des positiven Teils der gelben Kurve und ihres negativen Endes (wie reflektiert) ist die y-Achse).

whuber
quelle
1
Ich mag das Bild.
Karl
5

Sei . Die Verteilung von ist definitiv nicht die gleiche wie die von.XN(μ=1,SD=1)X|X>0|X|

Ein schneller Test in R:

x <- rnorm(10000, 1, 1)
par(mfrow=c(2,1))
hist(abs(x), breaks=100)
hist(x[x > 0], breaks=100)

Dies ergibt Folgendes. Simulationshistogramme

Karl
quelle