Diese Frage wurde mir in einem Interview mit gestellt. Gibt es eine "richtige" Antwort?
Angenommen, die Würfe sind iid und die Wahrscheinlichkeit von Köpfen ist . Die Verteilung der Anzahl der Köpfe in 400 Würfen sollte dann in der Nähe von Normal (200, 10 ^ 2) liegen, so dass 220 Köpfe 2 Standardabweichungen vom Mittelwert entfernt sind. Die Wahrscheinlichkeit, ein solches Ergebnis zu beobachten (dh mehr als 2 SDs vom Mittelwert in beide Richtungen entfernt), liegt bei etwas weniger als 5%.
Der Interviewer sagte mir im Wesentlichen: "Wenn ich etwas> = 2 SDs aus dem Mittelwert beobachte, schließe ich, dass etwas anderes vor sich geht. Ich würde wetten, dass die Münze fair ist." Das ist vernünftig - schließlich machen das die meisten Hypothesentests. Aber ist das das Ende der Geschichte? Für den Interviewer schien das die "richtige" Antwort zu sein. Was ich hier frage, ist, ob eine Nuance gerechtfertigt ist.
Ich konnte nicht anders, als darauf hinzuweisen, dass die Entscheidung, dass die Münze nicht fair ist, eine bizarre Schlussfolgerung in diesem Kontext des Münzwurfs ist. Habe ich recht, das zu sagen? Ich versuche es weiter unten zu erklären.
Erstens habe ich - und ich nehme an, auch die meisten Menschen - eine starke Priorität in Bezug auf Münzen: Es ist sehr wahrscheinlich, dass sie fair sind. Das hängt natürlich davon ab, was wir unter fair verstehen. Eine Möglichkeit wäre, "fair" als "mit einer Wahrscheinlichkeit von Köpfen" nahe "bei 0,5, beispielsweise zwischen 0,49 und 0,51, zu definieren."
(Sie können auch ‚fair‘ definieren was bedeutet , dass die Wahrscheinlichkeit von Köpfen ist genau 0,50, wobei in diesem Fall mit einer perfekt fairen Münze jetzt eher scheint un wahrscheinlich.)
Ihr Prior hängt möglicherweise nicht nur von Ihren allgemeinen Vorstellungen über Münzen ab, sondern auch vom Kontext. Wenn Sie die Münze aus Ihrer eigenen Tasche gezogen haben, können Sie sich sicher sein, dass sie fair ist. Wenn Ihr Zaubererfreund es aus seinem herauszieht, könnte Ihr Prior doppelköpfigen Münzen mehr Gewicht beimessen.
In jedem Fall ist es einfach, vernünftige Prioritäten zu finden, die (i) die Wahrscheinlichkeit erhöhen, dass die Münze fair ist, und (ii) die Ähnlichkeit Ihres Seitenzahns bewirken, selbst wenn Sie 220 Köpfe beobachten. Sie würden dann den Schluss ziehen, dass die Münze sehr wahrscheinlich fair ist, obwohl das Ergebnis 2 SDs vom Mittelwert abweicht.
Tatsächlich könnten Sie auch Beispiele konstruieren, bei denen das Beobachten von 220 Köpfen in 400 Würfen dazu führt, dass Ihr Posterior mehr Gewicht auf die faire Münze legt , zum Beispiel, wenn alle unfairen Münzen eine Wahrscheinlichkeit von Köpfen in .
Kann mir jemand etwas Licht ins Dunkel bringen?
Nachdem ich diese Frage geschrieben hatte, fiel mir ein, dass ich schon einmal von dieser allgemeinen Situation gehört hatte - ist es nicht Lindleys "Paradoxon" ?
Whuber hat einen sehr interessanten Link in die Kommentare eingefügt: Sie können einen Würfel laden , aber Sie können keine Münze voreingenommen lassen . Ab Seite 3:
Es ist nicht sinnvoll zu sagen, dass die Münze eine Wahrscheinlichkeit p von Köpfen hat, da sie vollständig durch die Art und Weise bestimmt werden kann, in der sie geworfen wird - es sei denn, sie wird mit einem schnellen Schleudergang hoch in die Luft geworfen und mit in der Luft gefangen kein Prellen, in diesem Fall ist p = 1/2.
Ziemlich cool! Dies knüpft auf interessante Weise an meine Frage an: Nehmen wir an, wir wissen, dass die Münze "mit einem schnellen Schleudern hoch in die Luft geworfen und in der Luft gefangen wird, ohne zu hüpfen". Dann sollten wir definitiv nicht die Hypothese ablehnen, dass die Münze fair ist (wobei "fair" jetzt "mit p = 1/2, wenn es auf die oben beschriebene Weise geworfen wird" bedeutet), weil wir effektiv einen Prior haben, der alle Wahrscheinlichkeit auf das setzt Münze ist fair. Vielleicht rechtfertigt das bis zu einem gewissen Grad, warum es mir unangenehm ist, die Null zurückzuweisen, nachdem 220 Köpfe beobachtet wurden.
Antworten:
Die übliche bayesianische Methode zur Lösung dieses Problems (ohne normale Näherungen) besteht darin, Ihren vorherigen Stand explizit anzugeben und ihn mit Ihrer Wahrscheinlichkeit zu kombinieren, die Beta-verteilt ist. Integrieren Sie dann Ihren Seitenzahn um 50%, sagen wir zwei Standardabweichungen oder von 49% –51% oder was auch immer Sie möchten.
Wenn Ihre vorherige Annahme bei [0,1] beständig ist - z. B. Beta (100,100) (diese legt eine Menge Masse auf ungefähr faire Münzen) - dann ist die Wahrscheinlichkeit, dass die Münze fair ist, null, da die Wahrscheinlichkeit ebenfalls beständig ist [0] , 1].
Selbst wenn die Wahrscheinlichkeit, dass die Münze fair ist, gleich Null ist, können Sie in der Regel jede Frage, die Sie beantworten wollten, mit dem Posterior über die Voreingenommenheit beantworten. Zum Beispiel, was ist der Casino-Vorteil bei der Verteilung nach hinten über die Münzwahrscheinlichkeiten.
quelle
Sagen wir für die Bernoulli Distribution, in diesem Fall den Münzwurf.
Mein Ruf reicht nicht aus, um einen Kommentar unter die Frage zu schreiben. Stattdessen werde ich hier etwas über You Can't Bias a Coin schreiben . @Adrian
Hier ist was wir haben
Hier ist unsere Hypothese
Hier ist unser Ergebnis
Andernfalls erstellen wir hier einen Doppelstandard für das Testen von Hypothesen. Wir können die Hypothese, dass der Münzwurf fair ist und die Versuchsdaten korrekt aufgezeichnet wurden, nicht akzeptieren .
Es ist nicht sinnvoll zu sagen, dass die Münze eine Wahrscheinlichkeit p von Köpfen hat
Wir haben experimentelle Ergebnisse, um diese Hypothese zu untermauern.
quelle