Stichprobe aus der Randverteilung unter Verwendung der bedingten Verteilung?

12

Ich möchte aus einer univariaten Dichte , aber nur die Beziehung:fX

fX(x)=fX|Y(x|y)fY(y)dy.

Ich möchte die Verwendung von MCMC (direkt auf der Integraldarstellung) vermeiden, und da und leicht sind, habe ich mir überlegt, den folgenden Sampler zu verwenden ::fX|Y(x|y)fY(y)

  1. Für .j=1,,N
  2. Beispiel .yjfY
  3. Beispiel .xjfX|Y(|yj)

Dann werde ich mit den Paaren und nur die Randproben . Ist das richtig?(x1,y1),...,(xN,yN)(x1,,xN)

Stange
quelle

Antworten:

10

Ja das ist korrekt. Grundsätzlich haben Sie

fX,Y(x,y)=fX|Y(x|y)fY(y),

und wie Sie sagten, können Sie aus der Fugendichte probieren. Wenn Sie nur die s aus den Stichproben aufnehmen, gelangen Sie zu einer Stichprobe aus der Randverteilung.x

Dies liegt daran, dass das Ignorieren des einer Integration darüber ähnelt. Lassen Sie uns dies anhand eines Beispiels verstehen.y

Angenommen, = Größe der Mütter und = Größe der Tochter. Das Ziel ist es, eine Stichprobe aus zu erhalten, um die Beziehung zwischen den Höhen der Töchter und ihrer Mütter zu verstehen. (Ich gehe davon aus, dass es nur eine Tochter in der Familie gibt, und beschränke die Bevölkerung auf alle Töchter über 18 Jahre, um ein volles Wachstum zu gewährleisten.)XY(X,Y)

Sie gehen raus und erhalten eine repräsentative Stichprobe

(x1,y1),,(xN,yN).

So haben Sie für jede Mutter die Größe ihrer Tochter. Es sollte eine klare Beziehung zwischen und . Angenommen, Sie ignorieren aus Ihrem Datensatz alle Daten zu den Töchtern (lassen Sie das ). Was haben Sie dann? Sie haben genau Höhen von zufällig ausgewählten Müttern, die Draws vom Rand von .XYYNX

Greenparker
quelle
Vielen Dank dafür, das ist hilfreich. Wissen Sie, ob diese Stichprobenstrategie mit Gibbs-Stichproben verknüpft werden kann, um sie formal zu rechtfertigen?
Rod
1
Wenn Sie leicht aus der gemeinsamen Verteilung eine Stichprobe ziehen können, muss das nicht ignoriert werden , um den Rand für zu erhalten . Es ist eine übliche Sache zu tun. Vielleicht können Sie sagen, dass eine Linchpin-Variable ist , aber da Sie keine Gibbs-Abtastung benötigen, um von abzutasten , ist hier keine MCMC erforderlich. yxyy
Greenparker
1
Greenparker, aber gibt es einen formalen Beweis für diese Behauptung, dh wenn nur ein Teil der aus dem Gelenk entnommenen Probe eine Probe aus dem Randbereich ergibt?
Ein alter Mann im Meer.
Wenn Sie "X = Mütter" durch Stichproben (X, Y) und X nehmen, erhalten Sie tatsächlich Stichproben von "Müttern, die genau eine ausgewachsene Tochter haben", was nicht mit "Müttern" identisch ist. Aber selbst wenn wir Ihr Beispiel dahingehend ändern, dass Sie an "X = Müttern mit genau einer ausgewachsenen Tochter" interessiert sind, verzerrt das Erreichen von X durch Stichproben (X, Y) Ihre Stichprobe basierend auf der Verteilung von Y. p (v ) = ∑ (u in Unterstützung (U)) (p (u, v))) = ∑ (u in Unterstützung (U)) (p (v | u) * p (u)) = (1 / sampleSize ( u)) * ∑ (u in Stichprobe (U)) (p (v | u))), da jeder Wert von u in der Stichprobe mit der Wahrscheinlichkeit p (u) erscheint - muss also p (v | u) gemittelt werden zieht
radumanolescu