Wie definiere ich eine Verteilung, bei der daraus gezogen wird, die mit einer Zeichnung aus einer anderen vordefinierten Verteilung korreliert?

11

Wie definiere ich die Verteilung einer Zufallsvariablen so, dass eine Ziehung aus eine Korrelation mit , wobei eine einzelne Ziehung aus einer Verteilung mit der kumulativen Verteilungsfunktion ? YYρx1x1FX(x)

OctaviaQ
quelle

Antworten:

21

Sie können es als Datengenerierungsmechanismus definieren. Zum Beispiel, wenn undXFX

Y=ρX+1ρ2Z

wobei und unabhängig von , dannZFXX

cov(X,Y)=cov(X,ρX)=ρvar(X)

Beachten Sie auch, dass da dieselbe Verteilung wie . Deshalb,var(Y)=var(X)ZX

cor(X,Y)=cov(X,Y)var(X)2=ρ

Wenn Sie also Daten aus generieren können, können Sie eine Variable generieren , die eine bestimmte Korrelation mit . Beachten Sie jedoch, daß die Randverteilung von wird nur seine in dem speziellen Fall , in der ist die Normalverteilung (oder eine andere additive Verteilung). Dies liegt an der Tatsache, dass Summen normalverteilter Variablen normal sind; das ist keine allgemeine Eigenschaft von Distributionen. Im allgemeinen Fall müssen Sie die Verteilung von berechnen, indem Sie die (entsprechend skalierte) Faltung der Dichte, die mit sich selbst berechnen .FXY(ρ)XYFXFXYFX

Makro
quelle
2
+1 Sehr schöne Antwort. Nitpick: In der letzten Zeile müssen Sie skalierte Versionen von . FX
whuber
Vielen Dank, Macro. Nur um etwas zu verdeutlichen - Sie meinen in Ihrem letzten Absatz, dass Sie das rho * X mit dem sqrt (1 - rho ^ 2) * X falten müssten? (Entschuldigung, ich konnte keine Formatierung bekommen, auch nicht HTML, um in diesem speziellen Kommentar zu funktionieren)
OctaviaQ
1
Convolve die Dichten in den Verteilungen der entsprechenden mit der Verteilung von . Dies ist ein Ergebnis der allgemeinen Tatsache, dass die Dichte der Summe zweier kontinuierlicher Zufallsvariablen die Faltung der beiden Dichten ist. ρX1ρ2X
Makro
1
Eine lange Zeit, aber ... Ideen, wie dies zu tun ist, um auch die marginale Verteilung von Y zu erzwingen?
Julián Urbano