Erwartete Anzahl unterschiedlicher Farben beim Zeichnen ohne Ersatz

15

Man betrachte eine Urne mit N Kugeln mit P verschiedenen Farben, wobei pi der Anteil der Kugeln mit der Farbe i unter den N Kugeln ist ( ipi=1 ). Ich zeichne nN Kugeln aus der Urne ohne Ersatz und Blick auf die Anzahl γ verschiedener Farben unter den Kugeln , die gezogen wurden. Was ist die Erwartung von γ als Funktion von n/N in Abhängigkeit von geeigneten Eigenschaften der Verteilung p ?

Um mehr Einblick zu geben: wenn N=P und pich=1/P für all ich , dann werde ich immer genau sehen , n Farben, das heißt, γ=P(n/N) . Andernfalls kann gezeigt werden , dass die Erwartung von γ ist >P(n/N) . Für festes P und N scheint der Faktor, mit dem multipliziert wird n/N, maximal zu sein, wenn pist einheitlich; vielleicht ist die erwartete Anzahl verschiedener Farben als Funktion von und z. B. der Entropie von p begrenzt ?n/Np

Dies scheint mit dem Problem des Kuponsammlers verbunden zu sein, mit der Ausnahme, dass die Probenahme ersatzlos durchgeführt wird und die Verteilung der Kupons nicht gleichmäßig ist.

a3nm
quelle
1
Ich denke, dieses Problem kann folgendermaßen angegeben werden: Wie viele Einträge ungleich Null werden in einer Stichprobe aus einer multivariaten hypergeometrischen Verteilung erwartet ?
Kodiologist

Antworten:

2

Angenommen , Sie haben Farben , bei denen k N . Lassen b i die Anzahl der Kugeln Farbe bezeichnen i so Σ b i = N . Sei B = { b 1 , , b k } und notiere E i ( B ) die Menge, die aus den i- Element-Teilmengen von B besteht . Lassen Q n , c bezeichnen die Anzahl der Möglichkeiten können wir wählen nkkNbiibi=NB={b1,,bk}Ei(B)iBQn,cnElemente aus der obigen Menge, so dass die Anzahl der verschiedenen Farben in der gewählten Menge . Für c = 1 ist die Formel einfach:cc=1

Qn,1=EE1(B)(eEen)

Für wir Sätze von Kugeln der Größe n zählen, die höchstens 2 Farben haben, abzüglich der Anzahl von Sätzen, die genau 1 Farbe haben:c=2n1

Qn,2=EE2(B)(eEen)(k11)Qn,1

(k11) is the number of ways you can add a color to a fixed color such that you will have 2 colors if you have k colors in total. The generic formula is if you have c1 fixed colors and you want to make c2 colors out of it while having k colors in total(c1c2k) is (kc1c2c1). Now we have everything to derive the generic formula for Qn,c:

Qn,c=EEc(B)(eEen)i=1c1(kici)Qn,i

cn balls is:

Pn,c=Qn,c/(Nn)

Also note that (xy)=0 if y>x.

Probably there are special cases where the formula can be simplified. I didn't bother to find those simplifications this time.

The expected value you're looking for the number of colors dependent on n is the following:

γn=i=1kPn,ii
jakab922
quelle
4
You call Pn,c a probability, but you seem to have defined it as a sum of integers. Did you forget to divide by something?
Kodiologist
Yes, I guess you're right. You need to divide by (Nn), but unfortunately it's still not right that way. If E,FEc(B) and EF I do doublecounting in the above formula.
jakab922
Seems like the formula can be fixed by using the sieve method. I will post a fix later today.
jakab922