Angenommen, ich habe eine Urne mit N verschiedenen Farben von Kugeln und jede andere Farbe kann unterschiedlich oft erscheinen (wenn 10 rote Kugeln vorhanden sind, müssen nicht auch 10 blaue Kugeln vorhanden sein). Wenn wir den genauen Inhalt der Urne vor dem Zeichnen kennen, können wir eine diskrete Wahrscheinlichkeitsverteilung bilden, die uns die Wahrscheinlichkeit angibt, mit der jede Farbe der Kugel gezeichnet wird. Ich frage mich, wie sich die Verteilung nach dem Ziehen von k Bällen ohne Ersatz aus der Urne im Durchschnitt ändert. Ich verstehe, dass wir, wenn wir aus der Urne ziehen, die Verteilung mit dem Wissen darüber aktualisieren können, was herausgenommen wurde, aber ich möchte wissen, wie wir die Form der Verteilung erwarten würden, nachdem wir k Kugeln entfernt haben. Ändert sich die Verteilung im Durchschnitt oder bleibt sie gleich? Wenn es nicht gleich bleibt, können wir eine Formel aufschreiben, wie die neue Verteilung nach k Draws im Durchschnitt aussehen soll?
quelle
Antworten:
"Direkte Berechnung": In der Urne befinden sich Kugeln mit Farben. Konzentrieren wir uns auf die Wahrscheinlichkeit , beim zweiten Zeichnen eine bestimmte Farbe, z. B. Weiß , zu zeichnen. Die Anzahl der weißen Kugeln sei . Sei die Farbe der Kugel, die beim ten Zug erhalten wird.m n w X i in m nw Xi i
Natürlich gilt das gleiche Argument für jede Farbe bei der zweiten Ziehung. Wir können dieselbe Art von Argument rekursiv anwenden, wenn wir spätere Ziehungen betrachten.
[Man könnte natürlich eine noch direktere Berechnung durchführen. Betrachten Sie die ersten Ziehungen als bestehend aus weißen Kugeln und nicht weißen Kugeln (mit der Wahrscheinlichkeit, die durch die hypergeometrische Verteilung gegeben ist), und führen Sie die entsprechende Berechnung wie oben beschrieben durch, jedoch für die Ziehung in Schritt ; man bekommt eine ähnliche Vereinfachung und Annullierung, aber es ist nicht besonders aufschlussreich, sie durchzuführen.]i k - i k + 1k i k−i k+1
Ein kürzeres Argument: Beschriften Sie die Kugeln nach dem Zufallsprinzip mit den Zahlen und ziehen Sie sie dann in der angegebenen Reihenfolge heraus. Die Frage lautet nun: "Ist die Wahrscheinlichkeit, dass ein gegebenes Etikett auf einer weißen Kugel platziert wird, dieselbe wie die Wahrscheinlichkeit, dass das Etikett auf einer weißen Kugel platziert wird?"k 11,2,...,n k 1
Jetzt sehen wir, dass die Antwort aufgrund der Symmetrie der Etiketten "Ja" sein muss. In ähnlicher Weise spielt es aufgrund der Symmetrie der Kugelfarben keine Rolle, dass wir "Weiß" sagten, so dass das Argument, dass Label und Label die gleiche Wahrscheinlichkeit haben, für jede Farbe gilt. Daher ist die Verteilung bei der ten Ziehung dieselbe wie bei der ersten Ziehung, solange wir keine zusätzlichen Informationen aus den früheren Ziehungen haben (dh solange die früher gezogenen Bälle nicht gesehen werden).1 kk 1 k
quelle
Der einzige Grund, warum es nicht ganz offensichtlich ist, dass die Verteilung unverändert bleibt (vorausgesetzt, mindestens eine Kugel bleibt übrig), ist, dass zu viele Informationen vorhanden sind. Lassen Sie uns das ablenkende Material entfernen.
Ignorieren Sie für einen Moment die Farbe jeder Kugel. Konzentriere dich auf einen Ball. Angenommen, Bälle werden zufällig entfernt (und nicht beobachtet), und dann wird ein Ball gezogen und beobachtet. Es spielt keine Rolle, in welcher Reihenfolge die Auswahl erfolgt. Sie können also auch den ersten gezogenen Ball beobachten (und dann weitere Bälle entfernen , wenn Sie darauf bestehen). Die Verteilung hat sich offensichtlich nicht geändert, da sie durch das Entfernen der anderen Kugeln nicht beeinflusst wird .k + 1 k kk k+1 k k
Dieses Argument - obwohl es durchaus gültig ist - könnte dazu führen, dass sich manche Menschen unwohl fühlen. Die folgende Analyse wird möglicherweise als strenger akzeptiert, da wir nicht aufgefordert werden, die Auswahlreihenfolge zu ignorieren.
Konzentriere dich weiter auf deinen Ball. Es wird eine gewisse Wahrscheinlichkeit , als Ball ausgewählt zu werden. Obwohl einfach zu berechnen ist, müssen wir seinen Wert nicht kennen: Alles, was zählt, ist, dass es für jeden Ball der gleiche Wert sein muss (weil alle Bälle gleich sind) und dass er ungleich Null ist. Wenn es jedoch Null wäre, hätte kein Ball eine Wahrscheinlichkeit, ausgewählt zu werden: Solange mindestens ein Ball übrig bleibt, ist . k + 1 p k p k ≠ 0pk k+1 pk pk≠0
Achten Sie wieder auf die Farben. Per Definition ist die Chance, dass eine bestimmte Farbe ausgewählt wird (nachdem Bälle zufällig entfernt wurden), die Summe der Chancen aller ursprünglichen farbigen Bälle geteilt durch die Summe der Chancen aller ursprünglichen Bälle. Wenn es ursprünglich Kugeln der Farbe und insgesamt Kugeln gibt, ist dieser Wertk C k C C nC k C kC C n
Wenn , hängt es nicht von , QED ab .k<n k
quelle
Lassen Sie die Verteilung des Zeichnens einer einzelnen Kugel - nachdem Sie bereits Bälle ohne Ersatz gezogen haben - eine kategoriale Verteilung wenn die Verteilung über solche kategorialen Verteilungen .k E(Dk) Dk
Ich denke, Sie fragen, ob konstant ist.E(Dk)
Ich halte es für. Angenommen, Sie ziehen schließlich alle Kugeln. Alle Permutationen der Kugeln sind gleich wahrscheinlich. Die Wahrscheinlichkeit des Zeichnens beträgt zunächst . Sie können Ihre Auswahl auf eine ebenso wahrscheinliche Permutation umstellen, bei der Ihr zuerst gewählter Ball zuletzt und Ihr zweiter gewählter zuerst ausgewählt wurde. Dieser Ball hat die Erwartung , die aufgrund der Symmetrie gleich muss . Durch Induktion sind alle gleich.E(D0) E(D1) E(D0) E(Di)
quelle
Die "erwartete Verteilung" ändert sich nicht. Man könnte ein Martingal-Argument gebrauchen! Ich werde dies später zur Antwort hinzufügen (ich reise jetzt).
Die Verteilung, abhängig von den früheren Ziehungen (für die späteren Ziehungen), ändert sich nur, wenn Sie die Ziehungen tatsächlich beobachten. Wenn Sie den Ball mit einer fest geschlossenen Hand aus der Urne ziehen und ihn dann wegwerfen, ohne seine Farbe zu beobachten (ich habe ein solches Theater effektiv als Klassendemonstration verwendet), ändert sich die Verteilung nicht. Diese Tatsache hat eine Erklärung: Bei Wahrscheinlichkeit geht es um Information, Wahrscheinlichkeit ist ein Informationskonzept.
Wahrscheinlichkeiten ändern sich also nur, wenn Sie neue Informationen erhalten (dh bedingte Wahrscheinlichkeiten). Wenn Sie den Ball ziehen und wegwerfen, ohne ihn zu beobachten, erhalten Sie keine neuen Informationen. Es gibt also nichts Neues, auf das Sie sich einstellen können. Wenn Sie also den tatsächlichen Informationssatz bedingen, hat sich dieser nicht geändert, sodass sich die bedingte Verteilung nicht ändern kann.
Ich werde dieser Antwort jetzt nicht viel mehr Details geben, sondern nur eine Referenz hinzufügen: Hosam M. Mahmoud: "Pólya Urn Models" (Chapman & Hall), die Urnenmodelle wie das in dieser Frage behandelt, und auch viel allgemeinere Urnen Schemata, auch unter Verwendung von Martingal-Methoden, um Grenzwerte zu erhalten. Die Martingal-Methoden werden für die Frage in diesem Beitrag jedoch nicht benötigt.
quelle