Faire Münztests

8

Dies mag ein sehr bekanntes Problem sein, aber ich bin mir nicht sicher, welche Methoden dafür gut wären.

Nehmen wir an, jemand bittet uns, 20 Mal eine Münze zu werfen, um zu prüfen, ob es sich um eine faire Münze handelt.

Dies ist eine ziemlich einfache Aufgabe. Wir könnten leicht Hypothesentests einrichten und den p-Wert testen.

Nehmen wir jedoch an, dass uns jemand bittet, noch 30 Mal eine Münze zu werfen und zu prüfen, ob es sich um eine faire Münze handelt.

Meine Frage ist ... wie kombinieren wir die vorherigen Daten (die wir gesammelt haben, nachdem wir die Münze 20 Mal geworfen haben) mit den neuen Daten (nachdem wir die Münze noch 30 Mal geworfen haben).

Gibt es eine gute Möglichkeit, dies zu tun? Kombinieren wir einfach beide Daten (und nehmen an, dass wir die Münze von Anfang an 50 Mal geworfen haben) und überprüfen wir die Hypothese? Oder gibt es einen besseren Weg, dies zu tun?

Jeder Hinweis wäre sehr dankbar.

user98235
quelle
Eine Untersuchungslinie wäre die Erforschung der "gruppensequenziellen Analyse".
whuber

Antworten:

4

Wenn Sie die Münze nach dem ersten Wurfsatz nicht getestet haben oder die Wahl getroffen haben, den zweiten Satz basierend auf dem ersten zu werfen, sollten Sie in der Lage sein, sie einfach zu einer großen Probe zu kombinieren.

Wenn Ihr Verhalten in irgendeiner Weise von dem abhängt, was im ersten Satz passiert ist, wirkt es sich auf die Eigenschaften des kombinierten Satzes aus, wenn es als eine große Stichprobe behandelt wird, im Vergleich zu den Eigenschaften, die gewesen wären, wenn es tatsächlich eine große Stichprobe gewesen wäre.

Wenn Sie die Münze nach dem ersten Satz getestet haben, sind die beiden Tests abhängig. (Wenn Sie es getestet hätten, aber unabhängig vom Ergebnis hätte es keinerlei Auswirkungen auf irgendetwas gehabt, könnten Sie es weiterhin einfach ignorieren, als wäre es nie passiert. Es ist jedoch möglicherweise besser, es als zwei Tests zu melden, einen davon n = 20 und eine Sekunde von n = 30 - es gibt verschiedene Möglichkeiten, unabhängige Tests nachträglich zu kombinieren ... aber auch dies würde erfordern, dass der zweite Satz nicht vom ersten abhängig ist.)


Als Antwort auf eine aufschlussreiche Frage in den Kommentaren:

Es ist nicht der Anteil der Köpfe, um den es in meiner Diskussion geht (ich kann die Münze nicht auf diese Weise beeinflussen). Es ist der Test davon, der betroffen ist. Wenn ich einem bestimmten Satz von Ergebnissen eine Bedeutung zuweise, aber die Aktionen basierend auf diesen Ergebnissen ändere, kann ich den Anteil ändern, mit dem ich die verschiedenen Schlussfolgerungen basierend auf meinem Experiment ziehen werde. Whubers Kommentar zu " Beste zwei von drei? " deutet darauf hin; Es ist nicht P (H), das geändert wird, indem "Beste zwei von drei" gesagt wird, wenn der Schwanz zuerst auftaucht, sondern die Schlussfolgerung, die auf dem Experiment basiert ("wer gewinnt den Wurf" in diesem Fall).

Sagen wir in den 20 Würfen der Frage, dass meine ursprüngliche Regel lautet: "Schließen Sie, dass die Münze in Richtung Kopf voreingenommen ist, wenn ich 15 oder mehr Köpfe sehe, und schließen Sie, dass sie in Richtung Schwänze voreingenommen ist, wenn ich 15 oder mehr Schwänze sehe". Ungefähr 2% der Zeit nenne ich eine faire Münze, die in Richtung Kopf voreingenommen ist, und ungefähr 2% der Zeit werde ich sagen, dass sie in Richtung Schwanz voreingenommen ist.

Betrachten Sie nun die Regel "Schließen Sie, dass die Münze in Richtung Köpfe voreingenommen ist, wenn ich 15 oder mehr Köpfe sehe, andernfalls werfen Sie 30 weitere Male und wenden Sie die Ablehnungsregel an, die ich angewendet hätte, als hätte ich zunächst 50 Mal geworfen", dann ich Ich bin nicht mehr so ​​wahrscheinlich zu sagen, dass es überhaupt voreingenommen ist, und es ist auch nicht so wahrscheinlich zu sagen, dass eine faire Münze in Richtung Kopf voreingenommen ist, als zu dem Schluss zu kommen, dass sie in Richtung Schwanz voreingenommen ist

Glen_b -State Monica
quelle
1
(+1) "Ich wette, wir drehen um. Ich rufe Köpfe. Ratten, es waren Schwänze. Beste zwei von drei? Beste drei von fünf? ..."
whuber
1
Wie würde die Kombination beider Sätze die asymptotische Tendenz zum Gesetz der großen Zahlen nicht verbessern, unabhängig von a priori Plänen? Was ist die Mathematik hinter den verschiedenen Szenarien?
Antoni Parellada
(Antwort wurde auf meine Antwort verschoben.)
Glen_b -State Monica