Fisher's Tee Verkostung, binomial exakter Test

7

Bitte sehen Sie hier das berühmte Fisher-Experiment über die Fähigkeit des Biologen B. Muriel Bristol-Roach , den Geschmack von rotem Tee zu erkennen (siehe Lady Tasting Tea ).

In diesem Experiment gab Fisher Bristol-Roach 8 Tassen Tee, von denen 4 hergestellt werden, indem zuerst Tee in die Tasse gegeben wird, und die anderen 4, indem zuerst Milch in die Tasse gegeben wird. Bristol-Roach wählte alle 4 nach der gleichen Methode zubereiteten Tassen bemerkenswert korrekt aus. Dann quantifizierte Fisher die Wahrscheinlichkeit, dass sie dies zufällig tat, und kam zu dem Schluss, dass sie zu klein war, um dies nur zufällig zu tun.

Ich frage mich, ob eine andere Methode verwendet werden kann, wobei der genaue Binomialtest hier mit verwendet wirdH.0: die Erfolgsquote = 0,5

Wäre dies ausreichend, um zu dem Schluss zu kommen, dass Bristol-Roach die Fähigkeit besitzt, die Tees zu unterscheiden, wenn der binomiale exakte Test erfolgreich abgelehnt wird H.0?

Wudanao
quelle
Um die Antwort von @brumar zu ergänzen: Ich stimme zu, dass der von brumar beschriebene Prozess zu einem Binomialtest mit p = 0,5 führen kann. Ich frage mich jedoch, ob der Münzwurf zur Entscheidung über die Zubereitungsmethode für jede Tasse notwendig ist. Wenn die Anzahl der Milch-First- und Tee-First-Tassen vorbestimmt war, die Dame die Anzahl jedoch nicht kennt, können wir dann nicht trotzdem einen Binomialtest mit p = 0,5 durchführen? Siehe das gleiche Problem hier diskutiert: stats.stackexchange.com/questions/136584/…
lostisle

Antworten:

8

Dies ist eine gute Idee, aber die Dame weiß, dass es für jede Sorte 4 Tassen Tee gibt. Dies ist eine wertvolle Information für die Dame, die etwas falsch macht, wenn wir den Prozess über eine Binomialverteilung modellieren. Das Problem ist, dass die Variablen (Erfolge bei jedem Versuch), die Sie berücksichtigen möchten, nicht unabhängig und identisch verteilt sind .

Ich denke, Sie haben darüber nachgedacht, den Prozess anhand mindestens eines dieser Fälle zu modellieren:

Fall 1 : Sie untersuchen die Anzahl der Erfolge unter den 4 ausgewählten Bechern.
Unter dieser Darstellung ist die Statistik 4 Erfolg über 4 Versuche. Unter der Null hätte jeder eine Wahrscheinlichkeit von 0,5, zuerst Milch zu sein. Dies ist mathematisch richtig, aber diese Wahrscheinlichkeiten sind nicht unabhängig.
Abbildung : Wenn es sich bei den Bechern A, B und C um Fehler handelt, besteht eine gute Chance, dass der letzte ein guter ist, da unter den 5 verbleibenden Bechern noch 4 Milch-Erstbecher und nur ein Milch-Nachbecher übrig sind.

Fall 2 : Sie untersuchen die Anzahl der Erfolge unter den 8 vorgestellten Bechern.
Unter dieser Darstellung beträgt die Statistik 8 Erfolge in 8 Versuchen. Dies ist das gleiche Problem der Nichtunabhängigkeit.
Illustration : Wenn sie die ersten 7 Tassen gut beurteilt hat, ist die Wahrscheinlichkeit, dass sie auch die letzte Tasse gut beurteilt, 1. Da es im Vergleich zum experimentellen Umfeld durch Eliminierung keine Möglichkeit gibt, dass die Dame bei 7 Tassen Recht hat und bei Unrecht einer.

In mathematischer beiden Fällen nicht unabhängig von .P.(successich)P.(successj)


Fisher hat dieses Problem vermieden, indem er den Auswahlprozess als Ganzes betrachtet und die Anzahl der erfolgreichen Auswahlen (also nur eine) geteilt durch die Anzahl der möglichen Auswahlen (4 unter 8 = 70) aufgezählt hat. Dennoch gibt es eine einfache Rohformel, die die Nichtunabhängigkeit berücksichtigt, die jedoch weniger schön ist als die Fisher-Lösung:

P.(success)=P.(X.1=1)×P.(X.2=1|X.1=1)×  P.(X.3=1|X.1=1X.2=1)×  P.(X.4=1|X.1=1X.2=1X.3=1)=4/.8×3/.7×2/.6×1/.5=1/.70

Ein Binomialtest wäre die richtige Antwort auf eine andere Art von Einstellung wie diese, die ich mir gerade ausgedacht habe.

  • Der Richter wirft eine schöne Münze, wenn er einen Milch-First-Tee zubereitet, wenn er einen Milch-After-Tee leitet. Offensichtlich kennt die Dame das Ergebnis des Münzwurfs nicht.
  • Die Dame kennt den Prozess und muss beurteilen, welche Art von Tasse Tee serviert wurde.

Mit dieser Einstellung wäre ein Binomialtest, wie Sie ihn beschrieben haben, mit : Erfolgsrate = 0,5 zweifellos ein guter Ansatz.H.0

brumar
quelle
Aha. Ich dachte, die Dame wüsste nicht, dass es genau 4 Tassen von jedem Typ gibt, und deshalb fragte ich. Der Binomialtest leidet, obwohl ich wirklich nicht viel weiß, nicht unter der Diskontinuität der Zufallsvariablen? Auch intuitiv denke ich immer noch, dass die Erfolgsrate = 0,5 leichter abzulehnen ist als das, was Fisher hier verwendet hat, obwohl ich nicht sagen kann, warum ...
Wudanao
Ja, es leidet darunter, da der Ablehnungsbereich weniger als 5% ausmacht. Es leidet unter Konservativität, insbesondere bei kleinen Proben. Ich verstehe den zweiten Teil Ihres Kommentars nicht, da der Binomial-Test nicht für das ursprüngliche Experiment zur Verkostung von Frauen verwendet werden kann.
Brumar
Summen. Mir wurde klar, dass meine aktuelle Antwort nicht wirklich gut ist. Ich bearbeite sie gerade.
Brumar
+1, das ist eine schöne Antwort. Ich habe das optimiertL.EINT.E.X.Zur leichteren Lesbarkeit und Entfernen der Leerzeichen vor den Doppelpunkten für eine typischere englische Interpunktion. Wenn es Ihnen nicht gefällt, rollen Sie es mit meiner Entschuldigung zurück.
Gung - Reinstate Monica