Ist es möglich, die Gewinnchancen eines Wettbewerbs mit mehreren Einsendungen zu schätzen, wenn ich die Aufschlüsselung der Einsendungen nicht kenne?

8

Angenommen, ich nehme an einem Wettbewerb mit den folgenden Regeln teil:

  • Jede Person kann bis zu 6 Einträge erhalten
  • Alle Einsendungen werden zusammengefasst und 25% der Einsendungen werden als Gewinner ausgewählt, maximal 25.
  • Jede Person kann nur einmal gewinnen, unabhängig von der Anzahl ihrer Einsendungen. Wenn jemandes Name erneut gezeichnet wird, wird er verworfen und ein neuer Name gezeichnet.
  • Ich weiß, wie viele Einträge ich habe (maximal 6)
  • Ich weiß, wie viele Einträge es insgesamt gibt, aufgeschlüsselt nach Eintragstyp
  • Ich weiß nicht , wie viele der Einträge Wiederholungseinträge derselben Person sind.

Die Anzahl der Einträge nach Typ ist wie folgt:

Typ 1: 42 Typ 2: 72 Typ 3: 119 Typ 4: 217 Typ 5: 156 Typ 6: 178

Ist es möglich, meine Gewinnchancen in dieser Situation abzuschätzen? Ich bin etwas verwirrt über die Tatsache, dass ich nicht vorhersagen kann, wie sich die frühen Gewinner auf meine Chancen auswirken werden, da ich nicht weiß, wie viele Einträge jeder Gewinner aus dem Pool entfernen wird.

Ich interessiere mich für die Lösung angesichts des Datensatzes, aber ich interessiere mich auch für das richtige Verfahren / den richtigen Algorithmus zur Berechnung.

agent86
quelle
Was bedeuten die "Typen"?
Makro
@Marco Die verschiedenen Arten von Tickets, die Sie verdienen können. Sie können also Lottoscheintypen 1 bis 6 verdienen, und 42 Personen haben Lottoschein Typ 1
Rachel
Ich habe Probleme, der Reihenfolge der Beiträge zu folgen, da sie von unten nach oben verlaufen. Aber angesichts der Zeit rechts neben dem Namen des Plakats denke ich, dass ich es herausgefunden habe. Würde mir bitte jemand sagen, ob ich das klar habe? Ich denke, die Antwort von whuber kann wegen der Mehrdeutigkeit zwischen Einträgen und Teilnehmern nicht richtig sein. Rachels Strategie, Worst-Case- und Best-Case-Szenarien zu erhalten, ist richtig, aber sie hat einen mathematischen Fehler gemacht, indem sie Prozentsätze hinzugefügt hat, wenn diese auf unterschiedlichen Nennern basieren können. Wenn wir diesen Fehler beheben, haben wir die richtigen Grenzen für die Lösung.
Michael R. Chernick
Ich fand es seltsam für Rachel, das Best-Case-Szenario als dasjenige zu bezeichnen, das den höchsten Gewinnprozentsatz und das Worst-Case-Szenario das niedrigste ergab. Gewinnen ist gut, oder? Der letzte Punkt, den ich klarstellen möchte: Kardinal gibt an, dass in diesem Fall 25% der Teilnehmer 25 überschreiten, sodass es nur 25 Gewinner geben wird. Er erhält dies, indem er weiß, dass mindestens 178 Personen angemeldet sind. Sobald die Anzahl der Teilnehmer 100 überschreitet, wird die Gesamtsumme der Gewinner gemäß den Regeln auf 25 begrenzt.
Michael R. Chernick
@ Cardinal Wie bist du auf die Nummer 178 gekommen? Ich habe alle Einträge nach Typen hinzugefügt, um insgesamt 784 zu erhalten. Im schlimmsten Fall für mich als Spieler haben alle 6 Einträge und 784/6 = 130,7. Daraus schließe ich, dass es mindestens 130 Eingänge geben muss. Dies bedeutet immer noch, dass der Cutoff von 25 gilt, aber wie sind Sie zu der höheren Zahl gekommen?
Michael R. Chernick

Antworten:

6

Die möglichen Chancen liegen zwischen 17,7% und 18,7%.

Der schlimmste Fall tritt auf, wenn alle außer Ihnen genau einen Eintrag in der Lotterie haben: Dies ist eine Konfiguration, die mit den Daten übereinstimmt (obwohl dies unwahrscheinlich ist!).

Zählen wir die Anzahl der Möglichkeiten, bei denen Sie nicht gewinnen. Dies ist die Anzahl der Möglichkeiten, Tickets aus den verbleibenden 784 - 6 Tickets zu ziehen, angegeben durch den Binomialkoeffizienten . (Es ist eine riesige Zahl). Die Gesamtzahl der Möglichkeiten - alle gleich wahrscheinlich in einer fairen Zeichnung - beträgt . Das Verhältnis vereinfacht zu , die etwa 82,22772% ist: Ihre Chancen nicht zu gewinnen. Ihre Gewinnchancen in dieser Situation betragen daher 1 - 82,22772% = 17,7228% .257846( 784(784625) (784-25)(784-30)/[(784)(784-5)](78425)(78425)(78430)/[(784)(7845)]

Der beste Fall tritt auf, wenn so wenige Personen wie möglich an der Lotterie beteiligt sind und so viele wie möglich und dann usw. Tickets haben. Angesichts der Tatsache, dass die "Edelstein" -Zahlen (in aufsteigender Reihenfolge) sind, impliziert dies5 ( 42 , 72 ,65(42,72,119,156,178,217)

  • Allenfalls können die Menschen haben Einträge je. 642=a66

  • Allenfalls Menschen können haben Einträge je. 57242=30=a55

    ...

  • Allenfalls Menschen können haben Einträge je. 2178156=22=a22

  • 1217178=39=a1 Personen haben jeweils Eintrag.1

Lassen Sie die Gewinnchance bezeichnen, wenn Sie (zwischen und ) Tickets in einer Lotterie mit Daten und Ziehungen. Die Gesamtzahl der Tickets beträgt daher . Betrachten Sie die nächste Auslosung. Es gibt sieben Möglichkeiten:j 1 6 a = ( a 1 , a 2 , , a 6 ) l = 25 1 a 1 + 2 a 2 +p(a,l,j)j16a=(a1,a2,,a6)l=251a1+2a2++6a6=n

  1. Eines Ihrer Tickets wird gezogen; du gewinnst. Die Chance dafür ist gleich .j/n

  2. Die Tickets eines anderen werden gezogen. Die Chance dafür ist gleich . Wenn sie von ihnen halten, werden alle Tickets aus der Lotterie entfernt. Wenn , wird das Zeichnen mit den neuen Daten fortgesetzt: wurde um verringert und wurde ebenfalls um verringert . Die Chance, dass eine Person mit Tickets in der Lotterie ausgewählt wird, ist gleich . Dies ergibt sechs disjunkte Möglichkeiten für .i i l 1 l 1 a i 1 i i a i / ( n - j ) , i = 1 , 2 , ... , 6(nj)/niil1l1ai1iiai/(nj)i=1,2,,6

Wir fügen diese Chancen hinzu, weil sie alle Ergebnisse ohne Überlappung aufteilen.

Die Berechnung wird in diesem Wahrscheinlichkeitsbaum rekursiv fortgesetzt, bis alle Blätter bei erreicht sind. Es ist viel Rechenaufwand (ca. = 244 Millionen Berechnungen), aber es dauert nur wenige Minuten (oder weniger, je nach Plattform). In diesem Fall erhalte ich 18,6475% Gewinnchancen.25 6l=0256

Hier ist der Mathematica- Code, den ich verwendet habe. (Es steht geschrieben : die vorhergehende Analyse parallel, es ist ein wenig effizienter durch einige algebraische Reduzierungen vorgenommen werden könnten und Tests für wenn zu reduziert ) . Hier ist das Argument nicht nicht die zählen Tickets , die Sie halten: es gibt die Verteilung Anzahl der Tickets, die alle anderen besitzen . 0 jai0aj

p[a_, l_Integer, j_Integer] /; l >= 1 := p[a, l, j] = Module[{k = Length[a], n},
    n = Range[k] . a + j;
    j/n + (n - j)/n ParallelSum[
       i a[[i]] / (n - j) p[a - UnitVector[k, i], l - 1, j], {i, 1, k}]
    ];
p[a_, 0, j_Integer] := 0;
(* The data *)
a = Reverse[Differences[Prepend[Sort[{42, 72, 119, 217, 156, 178}], 0]]];
j = 6; l = 25;
(* The solution *)
p[a - UnitVector[Length[a],j], l, j] // N

Vergleichen wir diese Antworten zur Überprüfung der Realität mit zwei naiven Näherungen (von denen keine ganz richtig ist):

  1. 25 Ziehungen mit 6 Tickets im Spiel sollten Ihnen ungefähr 6 * 25 von 784 Gewinnchancen geben. Dies sind 19,1%.

  2. Jedes Mal, wenn Ihre Chance, nicht zu gewinnen, bei (784-6) / 784 liegt. Erhöhen Sie dies auf die 25. Potenz, um Ihre Chance zu finden, nicht in der Lotterie zu gewinnen. Das Subtrahieren von 1 ergibt 17,5%.

Es sieht so aus, als wären wir im richtigen Stadion.

whuber
quelle
1
Ich mag dieses Problem, weil es ein reales Beispiel für zwei Arten von Unsicherheit darstellt: probabilistische Unsicherheit in der Lotterie und mangelndes Wissen über die tatsächliche Verteilung des Ticketbesitzes innerhalb der Lotterie. Ich habe die letztere Unsicherheit effektiv mit einer Intervallanalyse behandelt , die einfach versucht, die Möglichkeiten so eng wie möglich zu begrenzen. Andere mögen eine vorherige Verteilung vornehmen, um diese epistemische Unsicherheit zu beschreiben, aber ich kann mir angesichts der vorliegenden Informationen keinen gültigen Weg vorstellen, um einen solchen Vorgänger zu rechtfertigen.
whuber
Sie gehen jedoch davon aus, dass niemand zwei oder mehr Tickets eines bestimmten Typs ("Juwel") haben kann. Soweit ich sehen kann, ist dies in der Beschreibung des Problems durch die OPs (agent86s) nicht angegeben.
Michael R. Chernick
@Michael Du hast Recht, es ist nicht ganz klar in den Spielregeln, obwohl es stark impliziert ist, dass niemand mehr als einen von jeder Art von Edelstein sammelt. Vide Regel 1 in der ursprünglichen Frage: "Jede Person kann bis zu 6 Einträge erhalten."
whuber
1
Soweit mir bekannt ist (und während des Wettbewerbs demonstriert wurde), ist die Annahme aus den gegebenen Informationen richtig - niemand kann mehr als 6 Einträge haben, einen von jedem "Typ".
Agent86
1
Vielen Dank, dass Sie sich die Zeit genommen haben, dies zu beantworten! Ich habe seit gestern über dieses Problem nachgedacht und bin heute Morgen entschlossen aufgewacht, dies herauszufinden, wenn es mich umgebracht hat, und ich bin froh, eine großartige Erklärung zu sehen, die bereits veröffentlicht wurde, sodass ich jetzt nicht muss :)
Rachel
1

Wenn ich richtig gerechnet habe, haben Sie zwischen 19.43%und die 21.15%Chance, einen Preis zu gewinnen

Dies 19.43%ist das beste Szenario, in dem jeder Teilnehmer 6 Tickets hat

Dies 21.15%ist der schlimmste Fall, in dem jeder Teilnehmer außer Ihnen 1 Ticket hat

Beide Szenarien sind äußerst unwahrscheinlich, sodass Ihre tatsächlichen Gewinnchancen wahrscheinlich irgendwo dazwischen liegen. Eine Gewinnchance von ungefähr 1/5 scheint jedoch eine ziemlich solide Zahl zu sein

Die Details, wie diese Zahlen erhalten wurden, finden Sie in dieser Google-Tabelle. Um jedoch zusammenzufassen, wie sie erhalten wurden:

  1. Beginnen Sie mit der Gesamtzahl der Einträge (784) und Ihren Einträgen (6).
  2. Holen Sie sich die Chance zu gewinnen ( 6 / 784 = 0.77%)
  3. Subtrahieren Sie 6 für den besten Fall oder 1 für den schlechtesten Fall von TotalEntries
  4. Gewinnchance ( 6/778für den besten Fall 6/783für den schlechtesten Fall)
  5. Wiederholen Sie die Schritte 3-4, bis Sie 25 Prozent haben
  6. Addieren Sie die 25 Prozentsätze, um Ihre allgemeine Chance zu ermitteln, etwas zu gewinnen

Hier ist eine alternative Methode, um den ungefähren Prozentsatz zu erhalten, der einfacher, aber nicht so genau ist, da Sie nicht jedes Mal, wenn Sie einen Gewinner ziehen, doppelte Einträge entfernen.

6 (your tickets) / 784 total tickets = 0.00765
0.00765 chance to win * 25 prizes = 19.14 % chance to win

EDIT: Ich bin mir ziemlich sicher, dass mir etwas in meiner Mathematik fehlt und dass Sie nicht einfach solche Prozentsätze hinzufügen können (oder die prozentuale Gewinnchance mit der Anzahl der Preise multiplizieren können), obwohl ich denke, dass ich nah dran bin

Whobars Kommentar gibt eine Gewinnchance von 17,4%, obwohl ich noch die Formel herausfinden muss, die er gegeben hat, und sicherstellen muss, dass sie für den Wettbewerb korrekt ist. Vielleicht ein Wochenendprojekt :)

Rachel
quelle
Ich möchte nur darauf hinweisen, dass dies voraussetzt, dass Sie 6 Edelsteine ​​haben.
Murgatroid99
@ murgatroid99 Ja, die Frage lautete I know how many entries I have (the maximum, 6):) Ich kann die Tabelle für jeden bearbeitbar machen, der seine Gewinnchancen herausfinden möchte
Rachel
2
Ich denke, diese Zahlen liegen im Allgemeinen im richtigen Bereich, liegen aber um ein paar Prozent zurück. Es ist schwer zu sagen, da eine Beschreibung der von Ihnen durchgeführten Berechnung nicht im Beitrag selbst enthalten ist.
Kardinal
1
k(7787776)/(784783782)
2
1(n625)(n25)6n1n=784