Verteilung und Varianz der Anzahl der Dreiecke im Zufallsgraphen

10

Betrachten Sie einen Erdos-Renyi- Zufallsgraphen . Die Menge von Eckpunkten ist mit . Der Satz von Kanten wird durch einen zufälligen Prozess konstruiert.n V V = { 1 , 2 , ... , n } EG=(V(n),E(p))nVV={1,2,,n}E

Sei eine Wahrscheinlichkeit , dann tritt jedes ungeordnete Paar von Eckpunkten ( ) als Kante in mit der Wahrscheinlichkeit unabhängig von den anderen Paaren auf.0 < p < 1 { i , j } i j E pp0<p<1{i,j}ijEp

Ein Dreieck in ist ein ungeordnetes Tripel verschiedener Eckpunkte, so dass , und Kanten in sind .{ i , j , k } { i , j } { j , k } { k , i } G.G{i,j,k}{i,j}{j,k}{k,i}G

Die maximale Anzahl möglicher Dreiecke ist (n3) . Definieren die Zufallsvariable X die beobachtete Anzahl der Dreiecke in der Kurve sein G .

Die Wahrscheinlichkeit, dass drei Verbindungen gleichzeitig vorhanden sind, beträgt p3 . Daher ist der erwartete Wert von X gegeben durch E(X)=(n3)p3 . Naiv kann man vermuten, dass die Varianz gegeben ist durch E(X2)=(n3)p3(1p3) , aber dies ist nicht der Fall.

Der folgende Mathematica- Code simuliert das Problem:

n=50;
p=0.6;
t=100;
myCounts=Table[Length[FindCycle[RandomGraph[BernoulliGraphDistribution[n,p]],3,All]],{tt,1,t}];
N[Mean[myCounts]] // 4216. > similar to expected mean
Binomial[n,3]p^3 // 4233.6
N[StandardDeviation[myCounts]] // 262.078 > not similar to "expected" std
Sqrt[Binomial[n,3](p^3)(1-p^3)] // 57.612
Histogram[myCounts]

Was ist die Varianz von X ?

LBogaardt
quelle

Antworten:

4

Sei wenn ein Dreieck bildet. Dann ist und jedes . Dies haben Sie verwendet, um den erwarteten Wert zu berechnen.Yijk=1{i,j,k}X=i,j,kYijkYijkBernoulli(p3)

Für die Varianz besteht das Problem darin, dass die nicht unabhängig sind. In der Tat schreibe Wir müssen berechnen , was die Wahrscheinlichkeit ist, dass beide Dreiecke vorhanden sind. Es gibt mehrere Fälle:Yijk

X2=i,j,ki,j,kYijkYijk.
E[YijkYijk]
  • Wenn (gleiche 3 Eckpunkte), dann ist . Es wird solcher Begriffe in der Doppelsumme geben.{i,j,k}={i,j,k}E[YijkYijk]=p3(n3)
  • Wenn die Mengen und genau 2 Elemente gemeinsam haben, benötigen wir 5 Kanten, um die beiden Dreiecke zu erhalten, so dass . es wird solche Begriffe in der Summe.{i,j,k}{i,j,k}E[YijkYijk]=p512(n4)
  • Wenn die Mengen und 1 Element gemeinsam haben, müssen 6 Kanten vorhanden sein, damit . Es wird solche Begriffe in der Summe.{i,j,k}{i,j,k}E[YijkYijk]=p630(n5)
  • Wenn die Mengen und 0 Elemente gemeinsam haben, müssen 6 Kanten vorhanden sein, damit . Es wird solche Begriffe in der Summe.{i,j,k}{i,j,k}E[YijkYijk]=p620(n6)

Um zu überprüfen, ob wir alle Fälle abgedeckt haben, beachten Sie, dass sich die Summe zu summiert .(n3)2

(n3)+12(n4)+30(n5)+20(n6)=(n3)2

Wenn Sie daran denken, das Quadrat des erwarteten Mittelwerts zu subtrahieren, erhalten Sie Folgendes:

E[X2]E[X]2=(n3)p3+12(n4)p5+30(n5)p6+20(n6)p6(n3)2p6

Unter Verwendung der gleichen numerischen Werte wie in Ihrem Beispiel berechnet der folgende R- Code die Standardabweichung, die dem Wert von 262 aus Ihrer Simulation ziemlich nahe kommt.

n=50
p=0.6
sqrt(choose(n, 3)*p^3+choose(n, 2)*(n-2)*(n-3)*p^5+(choose(n, 3)*choose(n-3, 3)+n*choose(n-1, 2)*choose(n-3, 2))*p^6-4233.6^2)
298.7945

Der folgende Mathematica- Code berechnet auch die Standardabweichung, die das gleiche Ergebnis liefert.

mySTD[n_,p_]:=Sqrt[Binomial[n,3]p^3+12Binomial[n,4]p^5+30 Binomial[n,5]p^6+20Binomial[n,6]p^6-(Binomial[n,3]p^3)^2]
mySTD[50,0.6] // gives 298.795
Robin Ryder
quelle
2
Eigentlich ziemlich unkompliziert. Gut gemacht! Ich habe Ihre Antwort leicht aktualisiert, die Ausdrücke vereinfacht und Mathematica- Code hinzugefügt . Ich habe meine Simulation auch 10k Mal ausgeführt und einen Standard von 295,37 erhalten, sehr nahe am erwarteten Wert.
LBogaardt
1
Danke für die Bearbeitung. Ich bin froh, dass die Simulation mit 10.000 Iterationen die Antwort bestätigt!
Robin Ryder
Ich fand die ursprüngliche Referenz für gerichtete Graphen: Holland (1970). Eine Methode zum Erkennen von Strukturen in soziometrischen Daten.
LBogaardt
0

Ich biete einen etwas anderen Ansatz zum Ableiten von .X2

Mit der gleichen Fallunterscheidung wie Robin Ryder:

  • Wenn dh die 3 Eckpunkte gleich sind, müssen wir 3 Eckpunkte aus n möglichen auswählen . Es müssen 3 Kanten vorhanden sein . Kombiniert:{i,j,k}={i,j,k}(n3)p3(n3)p3

  • Wenn und zwei gemeinsame Eckpunkte haben, bedeutet dies, dass für die und umgekehrt (jedes Dreieck hat einen Scheitelpunkt, der nicht Teil des anderen Dreiecks ist). Wlog stellen Sie sich vor, und sind die erwähnten disjunkten Eckpunkte und = , = . Um = , = , müssen wir die gleichen zwei Eckpunkte aus n möglichen auswählen . Für{i,j,k}{i,j,k}v{i,j,k}v{i,j,k}v=kv=kiijjiijj(n2)kkWir müssen zwei weitere aus den verbleibenden Eckpunkten auswählen. Erster: und zweiter: . Da die Kanten und gleich sind, müssen 5 Kanten vorhanden sein . Kombiniert:(n2)(n3){i,j}{i,j}p5(n2)(n2)(n3)p5

  • Wenn und nur einen Scheitelpunkt gemeinsam haben, sind 4 disjunkt. Stellen Sie sich vor, wlog, dass = . Das heißt, wir müssen aus n möglichen Eckpunkten 1 auswählen . Für das Dreieck wählen wir 2 Eckpunkte aus den verbleibenden . Für das Dreieck wählen wir 2 aus den verbleibenden , was auf die Annahme zurückzuführen ist, dass und . Da wir nur einen Scheitelpunkt gemeinsam haben, müssen 6 Kanten vorhanden sein{i,j,k}{i,j,k}iin{i,j,k}(n1)(n12){i,j,k}(n3)(n32)j{i,j,k}k{i,j,k}p6 . Kombiniert:n(n12)(n32)p6

  • Für den letzten Fall: Wenn und keinen gemeinsamen Scheitelpunkt haben, sind die beiden Dreiecke getrennt. Wir wählen das erste Dreieck, 3 Eckpunkte aus n möglichen . Und das zweite Dreieck, 3 Eckpunkte von verbleibenden . Die Dreiecke sind disjunkt, dh sie teilen keine Kanten und Eckpunkte, daher müssen 6 Kanten vorhanden sein . Kombiniert:{i,j,k}{i,j,k}(n3)(n3)(n33)p6(n3)(n33)p6

Wie bei Robin Ryder können wir auch Folgendes überprüfen:

(n3)+(n2)(n2)(n3)+n(n12)(n32)+(n3)(n33)=(n3)2 gilt.

Dies führt zu:

Var[X]=E[X2]E[X]2=(n3)p3+(n2)(n2)(n3)p5+n(n12)(n32)p6+(n3)(n33)p6(n3)2p6.

Josh
quelle