n ∈ N a 1 , a 2 , . . . , a m n ist eine Menge mit Elementen, und sind feste positive ganze Zahlen kleiner oder gleich .
die Elemente von gleich wahrscheinlich sind, werden Abtastwerte getrennt und unabhängig von ohne Ersatz gezogen, deren Größe ist.
Die Kardinalität des Schnittpunkts der Stichprobenhat im Allgemeinen Unterstützung gleich , aber welcher Verteilung folgt sie?
combinatorics
Kaltes Wasser
quelle
quelle
Antworten:
Hier ist ein anderer Ansatz, der keine Rekursion beinhaltet. Es werden jedoch weiterhin Summen und Produkte verwendet, deren Länge von den Parametern abhängt. Zuerst werde ich den Ausdruck geben, dann erklären.
Wir haben
EDIT: Am Ende des Schreibens wurde mir klar, dass wir den obigen Ausdruck ein wenig konsolidieren können, indem wir die Binomialkoeffizienten zu hypergeometrischen Wahrscheinlichkeiten und Trinomialkoeffizienten kombinieren. Für das, was es wert ist, ist der überarbeitete Ausdruck Hier ist eine hypergeometrische Zufallsvariable, bei der -Ziehungen aus einer Population der Größe mit Erfolgszuständen entnommen werden.
Ableitung
Lassen Sie uns eine Notation erhalten, um die kombinatorischen Argumente (hoffentlich) ein wenig einfacher zu verfolgen. Währenddessen betrachten wir und fest. Wir werden , um die Sammlung geordneter Tupel , wobei jedes erfülltS a1,…,am C(I) m (L1,…,Lm) Li⊆S
Wir werden auch für eine identische Sammlung verwenden, außer dass wir anstelle von Gleichheit .C′(I) L1∩⋯∩Lm⊇I
Eine wichtige Beobachtung ist, dass relativ einfach zu zählen ist. Dies liegt daran, dass die Bedingung für alle gleich , so dass in Sinne Wechselwirkungen zwischen verschiedenen Werten beseitigt werden. Für jedes ist die Anzahl von die die Anforderung erfüllt, , da wir ein solches konstruieren können, indem wir eine Teilmenge von der Größe wählen und dann mit . Es folgt demC′(I) L1∩⋯∩Lm⊇I Li⊇I i i i Li (|S|−|I|ai−|I|) Li S∖I ai−|I| I
Nun kann unsere ursprüngliche Wahrscheinlichkeit über wie folgt ausgedrückt werden :C
Wir können hier gleich zwei Vereinfachungen vornehmen. Erstens ist der Nenner derselbe wie Zweitens zeigt ein Permutationsargument, dassnur abhängig von durch die Mächtigkeit. Da es Teilmengen von mit der Kardinalität , folgt, dass wobei eine beliebige feste Teilmenge von mit Kardinalität ist
Wenn wir einen Schritt zurücktreten, haben wir das Problem jetzt darauf reduziert, dass
Sei die verschiedenen Teilmengen von die durch Hinzufügen genau eines Elements zu . Dann (Dies bedeutet nur, dass wenn , dann enthält , enthält aber auch kein zusätzliches Element.) Wir haben jetzt das -Zählproblem in ein -Zählproblem umgewandelt, mit dem wir besser umgehen können. Genauer gesagt haben wirJ1,…,Jn−k S I0
Wir können Einschluss-Ausschluss anwenden, um die Größe des obigen Union-Ausdrucks zu behandeln. Die entscheidende Beziehung ist hier , dass für jede nicht leere , Dies liegt daran, dass wenn eine Nummer von , es auch deren Vereinigung enthält. Wir stellen außerdem fest, dass die Menge die Größe. DeshalbI⊆{1,…,n−k}
Schließlich durch Einsetzen des Ausdrucks am Ende in die Gleichung füroben und unter Konsolidierung der Summe erhalten wir wie beansprucht.|C(I0)|
quelle
Mir ist kein analytischer Weg zur Lösung dieses Problems bekannt, aber hier ist ein rekursiver Weg, um das Ergebnis zu berechnen.
Für wählen Sie Elemente aus von denen zuvor ausgewählt wurde. Die Wahrscheinlichkeit, Elemente in Ihrer zweiten Ziehung mit schneiden, ergibt sich aus der hypergeometrischen Verteilung:m=2 a2 n, a1 k≤min{a1,a2} L1
Wir können das ErgebnisWir können dieselbe Logik verwenden, um zu finden wobei die Kardinalität des Schnittpunkts von drei Abtastwerten ist. Dann,b2. P(b3=k∣n,b2,a3), b3
Finden Sie dies für jedes . Die letztere Berechnung ist numerisch nicht schwierig, da einfach das Ergebnis der vorherigen Berechnung ist und ein Aufruf von ist die hypergeometrische Verteilung.k∈{0,1,2,…,min(a1,a2,a3)} P(b2=l∣n,a1,a2) P(b3=k∣n,b2=l,a3)
Um zu finden , können Sie im Allgemeinen die folgenden rekursiven Formeln anwenden: für und was nur bedeutet, dassP(bm)
Hier ist es in R:
quelle