Verkürzte Normalverteilung über eine Vereinigung von Intervallen

8

Angenommen, ich möchte eine abgeschnittene Normalverteilung finden, aber anstatt sie in einem Intervall , wobei , ihre Definition in einem Intervall , wobei .(ein,b)- -<ein<b<(ein,b)(c,d)- -<ein<b<c<d<

Würde dies zunächst noch die Definition einer abgeschnittenen Normalverteilung erfüllen? Der Wikipedia-Artikel dazu definiert es nur mit , wobei und (und X ist normal mit Mittelwert und Varianz ) . Wenn es sich nicht um eine abgeschnittene Normalverteilung handelt, was ist es dann?(ein,b)- -<ein<b<ein<X.<bμσ2

Wenn es sich um eine abgeschnittene Normalverteilung handelt, wie würde ich sie berechnen? Ich dachte, ich könnte es mit dem Gesetz der Gesamtwahrscheinlichkeit angehen, aber dann würde ich nur die abgeschnittene Verteilung als 0,5-fache der abgeschnittenen Normalverteilung für jedes Intervall in der Union erhalten, und das macht für mich keinen Sinn es bedeutet, dass anstatt eines Wertes, den X mit maximaler Wahrscheinlichkeit annehmen könnte, zwei Peaks in der Verteilung mit gleicher Wahrscheinlichkeit vorhanden sind (es sei denn, ich mache es falsch).

Lernen
quelle

Antworten:

10

Was Sie beschreiben, ist keine abgeschnittene Normalverteilung an sich , aber ihre Wahrscheinlichkeitsdichtefunktion und ihre kumulativen Verteilungsfunktionen können auf die gleiche Weise berechnet werden, wie wir es im Allgemeinen mit abgeschnittenen Verteilungen tun. Sie müssen sie also durch den verbleibenden Bereich unter der Kurve dividieren dh von

ein<xb  c<xdf(x)dx=[F.(b)- -F.(ein)]]+[F.(d)- -F.(c)]]

wobei nicht abgeschnittene Dichte ist und nicht abgeschnittenes cdf ist. Dies kann auf eine beliebige Anzahl solcher Intervalle verallgemeinert werden.f(x)F.(x)

Die Dichte einer solchen Verteilung beträgt

G(x)={f(x)F.(b)- -F.(ein)+F.(d)- -F.(c)zum ein<xb  c<xd0Andernfalls

Um sich selbst zu überzeugen, können Sie dieses Ergebnis einfach durch einfache Simulation überprüfen (siehe unten).

Geben Sie hier die Bildbeschreibung ein

set.seed(123)

m <- 0
s <- 1
a <- -2
b <- -1
c <- 1
d <- 2

x <- rnorm(1e5, m, s)
y <- x[(x > a & x <= b) | (x > c & x <= d)]

g <- function(x, mean = 0, sd = 1, a, b, c, d) {
  ifelse((x > a & x <= b) | (x > c & x <= d),
         dnorm(x, mean = mean, sd = sd) /
           ((pnorm(b, mean = mean, sd = sd) - pnorm(a, mean = mean, sd = sd)) +
              (pnorm(d, mean = mean, sd = sd) - pnorm(c, mean = mean, sd = sd))),
         0)
} 

xx <- seq(-4, 4, by = 0.01)
hist(y, 100, xlim = c(-4, 4), freq = FALSE)
lines(xx, g(xx, m, s, a, b, c, d), col = "red")
Tim
quelle