Wie kann man beurteilen, ob eine Münze, die 900 Mal geworfen wurde und 490 Mal auftaucht, voreingenommen ist?

9

Eine Münze wird 900 Mal geworfen und Köpfe erschienen 490 Mal. Unterstützt das Ergebnis die Hypothese, dass die Münze unvoreingenommen ist?

Sanu
quelle
3
Nullhypothese: Münze ist unvoreingenommen. Alternativ, schwer zu wissen, ist möglicherweise die symmetrische Wahrscheinlichkeit eines Kopfes . Signifikanzniveau: Sie entscheiden. Wenn die Nullhypothese zutrifft, hat die Anzahl der Köpfe eine nahezu normale Verteilung, Standardabweichung . Jetzt ist ungefähr Standardabweichungseinheiten vom Mittelwert ( ), wenn die Nullhypothese gilt. Aus Tabellen mit normalem oder anderem Standard eine Wahrscheinlichkeit von etwa . Bei einem Signifikanzniveau von % lehnen wir die Nullhypothese ab. 1/2(900)(1/2)(1/2)=154902.664500.00781
1
Vielleicht möchten Sie einen Blick auf Hypothese Testing
7
Zum späteren Nachschlagen: Es wird dringend davon abgeraten, wörtliche Kopien Ihrer Frage an mehrere SE-Sites zu senden . Dies tritt häufig bei neuen Benutzern auf, die mit dieser Richtlinie nicht vertraut sind. Fühlen Sie sich also nicht schlecht. Denken Sie bitte daran. Willkommen auf der Website.
Kardinal
Diese Frage, die genau das ist, was OP Sanus Hausaufgabenproblem aussagt, oder Sanus Paraphrase der tatsächlich gestellten Frage, lautet: "Unterstützt das Ergebnis die Hypothese, dass die Münze unvoreingenommen ist?" Für alle Antworten wird die Nullhypothese als . Meine Frage ist: Unterstützen Beobachtungen jemals die Nullhypothese? Selbst wenn die Münze Mal von heruntergekommen ist, ist dies keine Unterstützung für die Nullhypothese; nur sehr schwache Beweise für die Ablehnung der Null. Der Beweis spricht immer für die Ablehnung der Null, niemals für die Null. 450 900P(Heads)=0.5450900
Dilip Sarwate
@ Dilip: Wenn Sie Gregs Antwort erneut lesen, werden Sie feststellen, dass Ihr Kommentar oben nicht ganz richtig ist. Ein Äquivalenztest (oder häufig ein Bioäquivalenztest) bietet eine Alternative, bei der es sich um eine leicht "unscharfe" Version der gewünschten Hypothese handelt, für die Beweise vorliegen sollen. Ich denke, Sie werden sofort sehen, warum wir etwas mehr Spielraum einräumen müssen, als wir wirklich möchten.
Kardinal

Antworten:

16

Hier ist die natürliche Nullhypothese dass die Münze unvoreingenommen ist, dh dass die Wahrscheinlichkeit eines Kopfes gleich . Die vernünftigste alternative Hypothese ist die , obwohl man für die einseitige alternative Hypothese . p 1 / 2 H 1 p 1 / 2 p > 1 / 2H0p1/2H1p1/2p>1/2

Wir müssen das Signifikanzniveau des Tests wählen . Das liegt an dir. Zwei traditionelle Zahlen sind % und %.151

Angenommen, die Nullhypothese gilt. Dann hat die Anzahl der Köpfe eine * Binomialverteilung mit dem Mittelwert und der Standardabweichung .(900)(1/2)=450(900)(1/2)(1/2)=15

Die Wahrscheinlichkeit, dass sich beim Werfen einer fairen Münze die Anzahl der Köpfe von um oder mehr (in beide Richtungen) unterscheidet, beträgt symmetrisch Dies ist nicht praktisch von Hand zu berechnen, aber Wolfram Alpha gibt eine Antwort von ungefähr .4045040

2k=490900(900k)(12)900.
0.008419

So , wenn die Münze unvoreingenommene war, dann eine Anzahl von Köpfen , dass unterscheidet sich von um oder mehr wäre ziemlich unwahrscheinlich. Es hätte eine Wahrscheinlichkeit von weniger als %. Bei einem Signifikanzniveau von % lehnen wir die Nullhypothese ab.40 1 14504011

Wir können auch die normale Annäherung an das Binomial verwenden, um die Wahrscheinlichkeit zu schätzen, dass die Anzahl der Köpfe unter der Nullhypothese oder beträgt . Unsere Normalen haben den Mittelwert und die Varianz beträgt mit der Wahrscheinlichkeit, dass eine Standardnormalen . Aus Tabellen für den Normalwert ergibt sich ein etwa . Verdoppeln Sie, um den linken Schwanz zu berücksichtigen. Wir erhalten ungefähr , ziemlich nahe an dem von Wolfram Alpha angegebenen Wert und unter %. Also, wenn wir410 p = 1 / 2 450 15 490 40 / 15 0,0039 0,0078 1 1 H 0490410p=1/24501549040/150.00390.007811\% als unser Signifikanzniveau lehnen wir erneut die Nullhypothese .H0

Anmerkungen: . In der normalen Annäherung an das Binom erhalten wir eine bessere Annäherung an die Wahrscheinlichkeit, dass das Binomial indem wir die Wahrscheinlichkeit berechnen, dass die Normalität . Wenn Sie es nachschlagen möchten, ist dies die Kontinuitätskorrektur . Wenn wir die normale Näherung mit Kontinuitätskorrektur verwenden, stellen wir fest, dass die Wahrscheinlichkeit von oder mehr oder oder weniger Köpfen etwa , was ziemlich nahe an der "genauen" Antwort von Wolfram Alpha liegt. So können wir eine sehr genaue Schätzung finden, indem wir, wie in den schlechten alten Zeiten, Tabellen der Standardnormalen verwenden und die Arithmetik "von Hand" ausführen. 490 489,5 490 410 0,0084681490489.54904100.008468

p > 1 / 2 p = 1 / 2 4902 . Angenommen, wir verwenden die etwas weniger natürliche Alternativhypothese . Wenn ist, die Wahrscheinlichkeit von oder mehr ungefähr . Bei einem Signifikanzniveau von % würden wir also die Nullhypothese ablehnen, und wir würden sie sogar ablehnen, selbst wenn wir das Signifikanzniveau .p>1/2p=1/24901 0,0050.0042110.005

Ein Signifikanzniveaus Einstellung ist immer dann notwendig, denn es ist möglich , für eine faire Münze Ausbeute sagen oder mehr Köpfe in Würfen, nur lächerlich unwahrscheinlich. 900550900


quelle
2
Diese Frage wurde als Hausaufgabe markiert. In solchen Fällen wird davon abgeraten, eine vollständige, in sich geschlossene Antwort zu geben, die der fragenden Person keine Arbeit überlässt.
Makro
1
Dies war eine Antwort von math.SE, die mit der Frage zusammengeführt wurde und von einem Benutzer mit sehr hohen Wiederholungszahlen auf math.SE verfasst wurde. Die Frage wurde dort damals nicht als Hausaufgabe markiert.
Kardinal
Ich verstehe die Logik von "Wenn die Münze unvoreingenommen wäre, wäre eine Anzahl von Köpfen, die sich von 450 mal 40 oder mehr unterscheiden, ziemlich unwahrscheinlich." Warum sollten wir die Wahrscheinlichkeit berechnen müssen 40 or more, aber nicht 40 or lessoder nur 40?
Ein Angebot kann den
und somit hat @ Marcos Antwort weniger Likes und weit mehr Kommentare, die sich aus den Verwirrungen ergeben: p
Evan Pu
8

Wenn die Münze unvoreingenommen ist, ist die Wahrscheinlichkeit von 'Köpfen' . Daher hat die Anzahl der in 900 Versuchen geworfenen Köpfe, , eine -Verteilung unter der Nullhypothese einer fairen Münze. Der Wert - die Wahrscheinlichkeit, ein so extremes oder extremeres Ergebnis zu sehen, wenn die Münze weit entfernt ist, ist XBinomial(900,112XpBinomial(900,12)p

P(X490)

Wenn Sie den 2-seitigen Wert suchen , wäre dasp

1P(410<X<490)

Ich überlasse es Ihnen zu beschreiben, warum dies der Fall ist.

Wir wissen, dass die Massenfunktion für ist YBinomial(n,p)

P(Y=y)=(ny)py(1p)ny

Ich überlasse es Ihnen, den gesuchten Wert zu berechnen . p

Hinweis: Die Stichprobengröße ist hier so groß, dass Sie die normale Annäherung an die Binomialverteilung verwenden können. Ich habe oben detailliert beschrieben, wie der genaue Wert berechnet wird .p

Makro
quelle
Sollte der Wert für einen zweiseitigen Test oder einen einseitigen Test berechnet werden? p
Dilip Sarwate
1
Ich würde mir zweiseitig vorstellen, da die Frage nur feststellen wollte, ob die Münze unvoreingenommen war oder nicht. Das heißt, es scheint, dass . Es ist jedoch unklar, ob es sich bei der obigen Beschreibung um die wörtliche Frage oder um eine Paraphrase handelt. Ha:p1/2
Makro
1
In diesem Fall und möglicherweise in vielen anderen Fällen impliziert die Symmetrie, dass der zweiseitige Wert genau doppelt so groß ist wie der einseitige Wert. Der einseitige Wert ist kleiner als während der zweiseitige Wert größer ist. Daher sollte die Null auf der Ebene von (ich weiß, nicht die häufiger verwendeten Ebenen von und ) abgelehnt werden, wenn wir einen einseitigen Test verwenden, und nicht abgelehnt werden, wenn wir einen zweiseitigen Test verwenden Prüfung. Ist das richtig? ppp0.005p0.5%5%1%
Dilip Sarwate
1
Ja, wenn Sie den Test mit Level , würden Sie den einseitigen Test und nicht den zweiseitigen Test ablehnen. Ob man einen einseitigen oder einen zweiseitigen Test durchführt oder nicht, sollte jedoch a priori ausgewählt werden, basierend auf der Forschungsfrage, damit dieses Problem in der Praxis nicht auftreten sollte. α=.005
Makro
"Ob man einen einseitigen oder einen zweiseitigen Test macht oder nicht, sollte a priori gewählt werden" ist gültig, aber was ist, wenn die Wahl nicht getroffen wurde? Sollte OP Sanu mitgeteilt werden, dass die experimentellen Daten die Hypothese stützen, dass die Münze auf dem Niveau von unverzerrt ist (Null wird durch einen zweiseitigen Test nicht verworfen), aber auch die Hypothese unterstützen, dass auf der Ebene von (null wird durch einseitigen Test abgelehnt)? 0.5%P(Heads)>120.5%
Dilip Sarwate
4

Das Beispiel von der Wikipedia-Seite zu Bayes Factor scheint für die Frage ziemlich relevant zu sein. Wenn wir zwei Modelle haben, M1, bei denen die Münze genau unverzerrt ist (q = 0,5), und M2, bei denen die Wahrscheinlichkeit eines Kopfes unbekannt ist, verwenden wir eine flache vorherige Verteilung auf 1. Wir berechnen dann den Bayes-Faktor

K=p(x=490|M0)p(x=490|M1)

wo

p(x=490|M1)=nchoosek(900,490)12900=7.5896×104

und

p(x=490|M2)=01nchoosek(900,490)q490(1q)410dq=1901

Gibt einen Bayes-Faktor von , der nach der üblichen Interpretationsskala "kaum erwähnenswert" ist.K1.4624

Beachten Sie jedoch, dass (i) der Bayes-Faktor eine eingebaute Occam-Strafe hat, die einfache Modelle bevorzugt, und M1 viel einfacher ist, da es keine Störparameter gibt, wie dies bei M2 der Fall ist; (ii) eine Pauschale vor ist physikalisch nicht sinnvoll, in der Praxis wird eine voreingenommene Münze nahezu fair sein, es sei denn, die Münze ist offensichtlich asymmetrisch; (iii) Es war ein langer Tag und ich hätte leicht einen Fehler machen können, wenn es um die Analyse von Annahmen zu Berechnungen ging.q

Beachten Sie, dass die Münze voreingenommen ist, wenn es sich um ein physisches Objekt handelt, da aufgrund ihrer Assymetrie nicht genau die Wahrscheinlichkeit besteht, dass sie von Kopf bis Schwanz herunterfällt.

Dikran Beuteltier
quelle
3

Ihre Frage kann auf verschiedene Arten beantwortet werden.

Der traditionelle Hypothesentest soll Möglichkeiten ausschließen, nicht unbedingt beweisen. In diesem Fall können wir als Nullhypothese verwenden und prüfen, ob die Daten (490 von 900 Köpfen) verwendet werden können, um diese Nullhypothese durch Berechnung eines p-Werts abzulehnen. Wenn der p-Wert kleiner als ist, lehnen wir die Null ab, aber ein p-Wert bedeutet nicht, dass wir sagen können, dass die Daten die Null unterstützen , sondern nur, dass sie mit der Annahme übereinstimmen, dass die Null wahr ist , aber in Wahrheit könnte die Null falsch sein, nur die Wahrheit ist ein Wert von sehr nahe bei .α > α p 0,5H0:p=0.5α>αp0.5

Der "Äquivalenz" -Ansatz würde darin bestehen, unverzerrt nicht als zu definieren , sondern einen kleinen Bereich um 0,5 zu wählen, der als . Wenn dann das Konfidenzintervall für den wahren Anteil vollständig innerhalb des Äquivalenzintervalls von "unverzerrt" liegt, würden die Daten die Hypothese von "unverzerrt" stützen.0,5 - ϵ < p < 0,5 + ϵp=0.50.5ϵ<p<0.5+ϵ

Ein anderer Ansatz wäre die Verwendung eines Bayes'schen Ansatzes, bei dem wir mit einer vorherigen Verteilung des wahren Anteils einschließlich einer Punktmasse bei 0,5 und des Restes der Wahrscheinlichkeitsverteilung über mögliche Werte. Kombinieren Sie das dann mit den Daten, um einen Posterior zu erhalten. Wenn die Posterioun-Wahrscheinlichkeit von hoch genug ist, würde dies die Behauptung stützen, unvoreingenommen zu sein.p = 0,5pp=0.5

Greg Snow
quelle
Beachten Sie, dass der Bayes'sche Ansatz häufig zu kontinuierlichen Posterioren führt und daher die posteriore Wahrscheinlichkeit von genau 0 ist. Die interessantere Frage ist dann, wie signifikant sich unsere posteriore Schätzung von 0,5 unterscheidet. p=0.5
Michael McGowan
2
@MichaelMcGowan: Wenn man mit einer vorherigen Punktmasse bei beginnt, gibt es auch eine hintere Punktmasse. Ob dieser Prior Sinn macht oder nicht, hängt vom Problem ab ...p=0.5
Xi'an
2

Und eine R-Illustration:

Unter der Nullhypothese können wir uns ein Zufallsvariablen-verteiltes Binom mit n = 900 und p = 0,5 ansehen (dh wenn die Münze unverzerrt wäre, dann wäre p = Wahrscheinlichkeit von Kopf (oder Zahl) = 0,5).

Wenn wir die Alternative testen möchten, dass Ha: p <> 0,5 bei Alpha 0,05 ist, können wir die Schwänze der Verteilung unter der Null wie folgt betrachten und sehen, dass 490 außerhalb des Intervalls {421, 479} liegt, und daher Ho ablehnen .

n<-900
p<-0.5
qbinom(c(0.025,0.975),size=n,prob=p)
# 421 479
B_Miner
quelle
1

Um den Bayes'schen Ansatz zu verdeutlichen:

Sie beginnen damit, nichts zu wissen, außer das P(Heads)ist in [0,1]. Beginnen Sie also mit einer maximalen Entropie vor -> uniform(0,1). Dies kann als Beta-Distribution dargestellt werden -> beta(1,1).

Jedes Mal, wenn Sie die Münze werfen, führen Sie eine Bayes'sche Aktualisierung der Münze P(Heads)durch, indem Sie jeden Punkt in der Verteilung mit der Wahrscheinlichkeit multiplizieren (multiplizieren Sie mit, xwenn Sie Köpfe rollen, multiplizieren Sie mit, (1-x)wenn Sie Schwänze erhalten), und normalisieren Sie die Gesamtwahrscheinlichkeit erneut auf 1 Dies ist, was die Beta-Distribution tut. Wenn der erste Wurf Köpfe sind, haben Sie beta(2,1). In deinem Fall hast du beta(490,510).

Von dort würde ich das 95% -Wahrscheinlichkeitsintervall berechnen, und wenn 0,5 nicht in diesem Intervall liegt, würde ich anfangen, misstrauisch zu werden.

Als ich diese Übung zum ersten Mal durchlief, war ich wirklich überrascht, wie lange die Konvergenz gedauert hat ... Ich begann, weil jemand sagte: "Wenn Sie eine Münze 100 Mal werfen, wissen Sie, dass P(Heads)+/- 1%", stellt sich heraus völlig falsch, du brauchst Größen von mehr als 100 Flips.

mdaoust
quelle
0

Nullhypothese, Ho: P = 0,5 (P = Q = 0,5)

H1: P> 0,5

wobei P die Wahrscheinlichkeit eines auftretenden Kopfes ist.

wir wissen, dass z = (pP) / sqrt (PQ / N)

wobei p = 490/900 = 0,54

Jetzt ist z = (0,54-0,5) / sqrt ((0,5 · 0,5) / 900)

z = 2

daher wird bei 5% LOS (dh 1,64 <2) Ho abgelehnt

daher ist die Münze voreingenommen .....

Mithun Krishnan k
quelle
1
Willkommen auf unserer Webseite! Haben Sie die anderen Antworten gelesen, bevor Sie geantwortet haben? Sie könnten die durchdachten Analysen genießen, die in mehreren von ihnen enthalten sind. Sie enthalten dieselben Berechnungen, daher frage ich mich, welcher Teil Ihrer Antwort oder deren Darstellungsform etwas Neueres oder Besseres darstellt als das, was bereits veröffentlicht wurde.
whuber