Ja das ist korrekt. Grundsätzlich haben Sie
fX,Y(x,y)=fX|Y(x|y)fY(y),
und wie Sie sagten, können Sie aus der Fugendichte probieren. Wenn Sie nur die s aus den Stichproben aufnehmen, gelangen Sie zu einer Stichprobe aus der Randverteilung.x
Dies liegt daran, dass das Ignorieren des einer Integration darüber ähnelt. Lassen Sie uns dies anhand eines Beispiels verstehen.y
Angenommen, = Größe der Mütter und = Größe der Tochter. Das Ziel ist es, eine Stichprobe aus zu erhalten, um die Beziehung zwischen den Höhen der Töchter und ihrer Mütter zu verstehen. (Ich gehe davon aus, dass es nur eine Tochter in der Familie gibt, und beschränke die Bevölkerung auf alle Töchter über 18 Jahre, um ein volles Wachstum zu gewährleisten.)XY(X,Y)
Sie gehen raus und erhalten eine repräsentative Stichprobe
(x1,y1),…,(xN,yN).
So haben Sie für jede Mutter die Größe ihrer Tochter. Es sollte eine klare Beziehung zwischen und . Angenommen, Sie ignorieren aus Ihrem Datensatz alle Daten zu den Töchtern (lassen Sie das ). Was haben Sie dann? Sie haben genau Höhen von zufällig ausgewählten Müttern, die Draws vom Rand von .XYYNX