Generieren von binomialen Zufallsvariablen mit gegebener Korrelation

8

Angenommen, ich weiß, wie unabhängige binomiale Zufallsvariablen generiert werden. Wie kann ich zwei Zufallsvariablen und so generieren, dassY X Bin ( 8 , 2XY

XBin(8,23),YBin(18,23)  and  Corr(X,Y)=0.5

Ich dachte daran, die Tatsache zu nutzen, dass und unabhängig sind, wobei aber ich glaube nicht, dass binomial verteilt ist, daher kann ich diese Methode nicht verwenden. Wenn dies funktioniert hätte, hätte ich zwei Binomial-Zufallsvariablen erzeugt, sagen wir und , dann und dh und daher hätte ich das Paar . Aber ich kann das nicht tun, da nicht binomial verteilt ist.Y - ρ X ρ = C o r r ( X , Y ) X - ρ Y A B X = A Y - ρ X = B Y = B + ρ A ( X , Y ) Y - ρ X.XYρXρ=Corr(X,Y)XρYABX=AYρX=BY=B+ρA(X,Y)YρX

Jeder Hinweis wird geschätzt, wie vorzugehen ist.

Landon Carter
quelle
Eigentlich kam dieses Problem in einer Semesterprüfung, es ist also keine Hausaufgabe, aber man kann es Selbststudium nennen, denke ich. Tag hinzugefügt.
Landon Carter

Antworten:

8

Sie können die lineare Darstellung der Korrelation nicht in diskreten Unterstützungsverteilungen verwenden.

Im Sonderfall der Binomialverteilung ist die Darstellung kann ausgenutzt werden, da Wenn wir einige der so auswählen , dass sie einigen der und anderweitig unabhängig generiert werden, erhalten wir wobei die Notation gibt an, dass identisch mit und nicht als Bernoulli generiert wirdCOV ( X , Y ) = 8 Σ i = 1 18 Σ j = 1 cov ( δ i , γ j ) δ i γ j COV ( X , Y ) = 8 i = 1 18 j = 1

X=i=18δiY=i=118γiδi,γiB(1,2/3)
cov(X,Y)=i=18j=118cov(δi,γj)
δiγj
cov(X,Y)=i=18j=118I(δi:=γj)var(γj)
I(δi:=γj)δiγjB(1,2/3) .

Da die Einschränkung wir lösen Dies bedeutet, dass Wenn wir 6 der 8 gleich 6 der 18 , sollten wir diese Korrelation von 0,5 erhalten.

cov(X,Y)=0.5×8×18×23×13
i=18j=118I(δi:=γj)=0.5×8×18=6
δiγj

Die Implementierung sieht wie folgt aus:

  1. Generiere , , ;ZB(6,2/3)Y1B(12,2/3)X1B(2,2/3)
  2. Nimmt undX=Z+Z1Y=Z+Y1

Wir können dieses Ergebnis mit einer R-Simulation überprüfen

> z=rbinom(10^8,6,.66)
> y=z+rbinom(10^8,12,.66)
> x=z+rbinom(10^8,2,.66)
cor(x,y)
> cor(x,y)
[1] 0.5000539

Kommentar

Dies ist eine ziemlich künstliche Lösung des Problems, da es nur funktioniert, weil ein perfektes Quadrat ist und weil eine ganze Zahl ist. Für andere akzeptable Korrelationen wäre eine Randomisierung erforderlich, dh wäre mit einer gewissen Wahrscheinlichkeit Null oder Eins .8×18cor(X,Y)×8×18I(δi:=γj)ϱ

Nachtrag

Das Problem wurde vor Jahren auf Stack Overflow mit der gleichen Idee vorgeschlagen und gelöst , Bernoullis zu teilen.

Xi'an
quelle
1
+1. Sie brauchen nicht, dass ein Quadrat ist. Die Bedingungen für Cor , um eine Lösung (über diese Methode) für Binomial und Binomial sind (1) und ( 2) ist eine ganze Zahl. Für bestimmte negative bietet die Verwendung einer Multinomialverteilung eine Lösung. Ein allgemeinerer - aber schwierigerer - Ansatz würde Copulas verwenden. 8×18(X,Y)=ρX(n,p)Y(m,q)p=qρ0ρmnmin(m,n)ρ
whuber
@whuber: Für die negative Korrelation habe ich zuerst daran gedacht, aber es funktioniert offensichtlich nicht. Könnten Sie die generische Lösung erweitern? (Ich dachte auch an Copulas, aber das Kalibrieren von Copulas, um die richtige Korrelation zu erreichen, ist eine böse Angelegenheit, nicht wahr?!1γj
Xi'an
Xi'an, ich möchte Sie fragen, ob die von Ihnen verwendete Methode eine Standardmethode ist. Das liegt daran, dass ich viel im Internet gesucht habe und nichts gefunden habe.
Landon Carter
2
Ich stimme dir zu - ich möchte nicht mit diesen Copulas arbeiten! Aber sie zeigen zumindest, dass Lösungen (innerhalb bestimmter Grenzen von , abhängig von den anderen Parametern) in der allgemeinsten Umgebung existieren sollten. Es wäre interessant herauszufinden, ob einfachere Konstruktionen, wie die hier angegebene, zur Geltung gebracht werden könnten, um Fälle zu behandeln, in denen oder . Yedaynara: Die Methode zum Aufteilen von zwei Variablen in ist Standard für jede parametrische Familie, die unter Addition geschlossen wird. und das ist alles was hier los ist. p q ρ < 0 X , Y X ' + Z , Y ' + Z.ρpqρ<0X,YX+Z,Y+Z
whuber
@yedaynara: Ich bin überrascht, dass Sie "nichts" finden konnten, als ich "korrelierte Binomial-Simulation" googelte und diesen Beitrag sofort auf Stack Overflow fand .
Xi'an