Angenommen, ein Spiel bietet ein Ereignis, das nach Abschluss entweder eine Belohnung oder nichts gibt. Der genaue Mechanismus zum Bestimmen, ob die Belohnung gegeben wird, ist unbekannt, aber ich gehe davon aus, dass ein Zufallszahlengenerator verwendet wird, und wenn das Ergebnis größer als ein fest codierter Wert ist, erhalten Sie die Belohnung.
Wenn ich im Grunde genommen rückentwickeln möchte, welchen Wert die Programmierer verwendet haben, um zu bestimmen, wie oft die Belohnung vergeben wird (geschätzte 15-30%), wie berechne ich die Anzahl der benötigten Samples?
Ich habe hier mit dem Abschnitt "Schätzer der wahren Wahrscheinlichkeit" begonnen: Checking_whether_a_coin_is_fair , bin mir aber nicht sicher, ob ich auf dem richtigen Weg bin. Ich erhielt Ergebnisse von ~ 1000 Proben, die für einen maximalen Fehler von 3% bei 95% iger Sicherheit benötigt wurden.
Letztendlich versuche ich Folgendes zu lösen:
- Event # 1 gibt Belohnung 1.0R, X% der Zeit
- Event # 2 gibt Belohnung 1.4R, Y% der Zeit
Ich möchte X & Y genau genug schätzen, um festzustellen, welches Ereignis effizienter ist. Große Stichproben sind ein Problem, da ich höchstens alle 20 Minuten eine Stichprobe erhalten kann.
Antworten:
quelle
Anscheinend möchten Sie für Ereignis 1 den Wert von schätzenX Y
quelle
Ich weiß, dass es weniger elegant ist, aber ich musste es simulieren. Ich habe nicht nur eine ziemlich einfache Simulation erstellt, sondern sie ist auch unelegant und läuft nur langsam. Es ist jedoch gut genug. Ein Vorteil ist, dass, solange einige der Grundlagen stimmen, es mir sagen wird, wann der elegante Ansatz nachlässt.
Die Stichprobengröße wird in Abhängigkeit vom fest codierten Wert variieren.
Also hier ist der Code:
Und hier ist die grafische Darstellung der Stichprobengröße gegenüber der Prävalenz, sodass die Unsicherheit bei 95% CI für die Prävalenz so nahe wie möglich liegt±
Abgesehen von 50% scheinen "etwas weniger Beobachtungen" erforderlich zu sein, wie kjetil vorschlug.
Ich denke, dass Sie vor 400 Stichproben eine anständige Schätzung der Prävalenz erhalten und Ihre Stichprobenstrategie im Laufe der Zeit anpassen können. Ich denke nicht, dass es in der Mitte einen Lauf geben sollte, und so könnten Sie N_loops bis zu 10e3 und das "by" in "my_prev" auf 0,001 erhöhen.
quelle