Erwarteter Wert des Produkts nicht unabhängiger Bernoulli-Zufallsvariablen (Korrelationen sind bekannt)

7

Ich habe eine Frage zum Ermitteln der gemeinsamen Wahrscheinlichkeitsverteilung für Bernoulli-Zufallsvariablen gestellt, unter Berücksichtigung des erwarteten Werts für jede Variable ( und ihrer Korrelationen ( ). Jemand hat mich freundlicherweise auf dieses Papier verwiesen , und es war wirklich hilfreich, aber ich kann immer noch keinen letzten Punkt herausfinden:NE[Xi]=pi)ρ12,ρ13,

Vorausgesetzt, ich kenne die Korrelationsmatrix für die Bernoulli-Zufallsvariablen: Wie kann ich den erwarteten Wert für das Produkt von allen erhalten: N

E[j=1NXj]=?

Für zwei Bernoulli-Zufallsvariablen weiß ich, dass der erwartete Wert ist: wobei die Kovarianz von und . Wenn ich jedoch mit drei Zufallsvariablen arbeite, kann ich keinen Weg finden. Mein Bauch sagt mir, dass es eine Funktion der Kovarianzen sein kann, aber ich weiß es nicht genau.

E[X1·X2]=σ12+p1·p2
σ12X1,X2pj=E[Xj]

Kannst du mich in die richtige Richtung weisen?

Barranka
quelle

Antworten:

6

Normalerweise bestimmen bivariate Beziehungen keine multivariaten, daher sollten wir erwarten, dass Sie diese Erwartung nicht nur für die ersten beiden Momente berechnen können . Das Folgende beschreibt ein Verfahren zur Erzeugung einer Menge von Gegenbeispielen und zeigt ein explizites für vier korrelierte Bernoulli-Variablen.


Betrachten Sie im Allgemeinen Bernoulli-Variablen . Das Anordnen der möglichen Werte von in Zeilen erzeugt eine Matrix mit Spalten, die ich nenne . Die entsprechenden Wahrscheinlichkeiten dieser -Tupel seien durch den Spaltenvektor . Dann werden die Erwartungen des auf die übliche Weise als Summe von Werten mal Wahrscheinlichkeiten berechnet; nämlich.,kXi,i=1,,k2k(X1,X2,,Xk)2k×kx1,,xk2k kp=(p1,p2,,p2k)Xi

E(Xi)=pxi.

In ähnlicher Weise werden die zweiten (nicht zentralen) Momente für as gefundenij

E(XiXj)=p(xixj).

Die Adjunktion zweier Vektoren in Klammern bezeichnet ihr Term-by-Term-Produkt (das ein weiterer Vektor gleicher Länge ist). Wenn , , dass die zweiten Momente bereits bestimmt sind.i=j(xixj)=(xixi)=xiE(Xi2)=E(Xi)

Da eine Wahrscheinlichkeitsverteilung darstellt, muss dies der Fall seinp

p0

(was bedeutet, dass alle Komponenten von nicht negativ sind) undp

p1=1

(wobei ein Vektor von Einsen ist).12k

Wir können alle vorstehenden Informationen sammeln, indem wir eine Matrix deren Spalten , und für . Diesen Spalten entsprechen die Zahlen , und . Das Einfügen dieser Zahlen in einen Vektor ergibt die linearen Beziehungen2k×(1+k+(k2))X1xi(xixj)1i<jk1E(Xi)E(XiXj)μ

pX=μ.

Das Problem, einen solchen Vektor zu finden, der den linearen Bedingungen unterliegt, ist der erste Schritt der linearen Programmierung: Die Lösungen sind die realisierbaren . Im Allgemeinen gibt es entweder keine Lösung, oder wenn es eine gibt, wird es eine ganze Mannigfaltigkeit von mindestens . Wenn , können wir daher erwarten, dass es unendlich viele Verteilungen auf , die den angegebenen Momentvektor reproduzieren . Nun ist die Erwartung einfach die Wahrscheinlichkeit vonpp02k(1+k+(k2))k3(X1,,Xk)μE(X1X2Xk)(1,1,,1). Wenn wir also zwei davon finden, die sich im Ergebnis unterscheiden , haben wir ein Gegenbeispiel.(1,1,,1)

Ich kann kein Gegenbeispiel für , aber sie sind für reichlich vorhanden . Angenommen, alle sind Bernoulli und für . (Wenn Sie es vorziehen, .) Ordnen Sie die Werte in der üblichen binären Reihenfolge von . Dann (zum Beispiel) die Verteilungenk=3k=4Xi(1/2)E(XiXj)=3/14ijρij=6/72k=16(0,0,0,0),(0,0,0,1),,(1,1,1,1)

p(1)=(1,0,0,2,0,2,2,0,0,2,2,0,2,0,0,1)/14

und

p(2)=(1,0,0,2,0,2,2,0,1,1,1,1,1,1,1,0)/14

reproduzieren Sie alle Momente durch Bestellung aber geben Sie unterschiedliche Erwartungen für das Produkt an: für und für .21/14p(1)0p(2)

Hier ist das Array an die beiden Wahrscheinlichkeitsverteilungen angrenzt und als Tabelle dargestellt ist:X

1x1x2x3x4x1x2x1x3x2x3x1x4x2x4x3x4p(1)p(2)100000000001141141000100000000100100000000010011100000171710100000000001010101000017171011000100017171011111100000110000000000114110010001001711411010000010171141101110011001141110000000117114111010101010114111100010110114111111111111140

Das Beste, was Sie mit den gegebenen Informationen tun können, ist, einen Bereich für die Erwartung zu finden. Da die möglichen Lösungen eine geschlossene konvexe Menge sind, sind die möglichen Werte von ein geschlossenes Intervall (möglicherweise ein leeres, wenn Sie mathematisch unmögliche Korrelationen oder Erwartungen angegeben haben). Finden Sie die Endpunkte, indem Sie zuerst maximieren und dann mit einem beliebigen linearen Programmieralgorithmus minimieren.E(X1Xk)p2k

whuber
quelle