Power of Lady Verkostung Tee Experiment

9

In dem bekannten Experiment Fisher die beobachtbare ist die Anzahl der korrigierten erraten cup mit zwei Arten von Cup A und B . Normalerweise ist es interessant, den kritischen Bereich zu berechnen, um die Nullhypothese (die Dame schätzt zufällig) angesichts der Größe des Tests α abzulehnen . Dies ist mit der hypergeometrischen Verteilung leicht möglich. Auf die gleiche Weise kann ich die Größe des Tests für den kritischen Bereich berechnen.kABα

Eine andere Frage ist: Wie berechnet man die Leistung des Tests bei einer alternativen Hypothese? Nehmen wir zum Beispiel an, dass die Dame mit der Wahrscheinlichkeit auf der einzelnen Tasse richtig raten kann ( P ( Vermutung A | wahr A ) = P ( Vermutung  B | wahr  B ) = 0,9 ). Was ist die Testkraft, wenn eine Gesamtzahl von Bechern gleich N = 8 und eine Gesamtzahl von Bechern einer Art n = N / 2 = 4 angenommen wird?p=90%P(guessA|trueA)=P(guess B|true B)=0.9N=8n=N/2=4? (Leider) weiß die Dame .n

Mit anderen Worten gesagt: Wie ist die Verteilung von (Anzahl der richtigen Tassen unter der alternativen Hypothese), wenn die Dame weiß, dass es n Tassen einer Art gibt?k=n

Ruggero Turra
quelle
0.94=0.6561
N=8N8
1
Dies ist ein interessantes, aber schwieriges Problem. Es ist einfach, die Tabellen zu bestimmen, die dazu führen würden, dass Ho abgelehnt wird, aber man müsste über die Wahrscheinlichkeit nachdenken, diese Tabellen unter Ha zu sehen. Der folgende Artikel berechnet die Leistung für eine leicht modifizierte Tabelle mit einer bestimmten Sensitivität und Spezifität: "Eine Verallgemeinerung des Lady-Tasting-Tea-Verfahrens zur Verknüpfung qualitativer und quantitativer Ansätze in der psychiatrischen Forschung" von Falissard et al. Ich bin mir nicht sicher, ob die Berechnungen korrekt sind. Wenn Sie wirklich ein Binomialproblem haben, können Sie das Exact R-Paket verwenden, aber dies ist ein anderes Problem
Peter Calhoun

Antworten:

3

Unter der Alternative errät die Dame nicht zufällig, aber "nicht zufällig erraten" deckt eine Unendlichkeit verschiedener Situationen ab. Sie könnte immer perfekt raten oder sie könnte nur geringfügig besser raten als zufälliges Raten ... und im allgemeinen Fall gibt es nicht einmal eine einzelne Variable "Skala", die nicht zufällig bearbeitet werden kann (also haben wir nicht einmal eine Macht Kurve, es sei denn, wir beschränken die Art der nicht zufälligen Antworten, die sie geben könnte).

Um eine Potenz zu berechnen, müssen wir sehr genau wissen, wie sie nicht zufällig ist (und wie nicht zufällig sie auf diese bestimmte Weise ist).

(,)μ0σ2=1/ω2ω2μ1σ2μ1=μ0=1

Das ist eine bestimmte Art von Modell dafür, wie sie "besser als zufällig" abschneiden könnte, mit dem wir Parameter angeben und einen Wert für die Leistung erhalten könnten.

Wir könnten natürlich viele andere Formen der Nicht-Zufälligkeit als diese annehmen.

Glen_b - Monica neu starten
quelle
3

Die Verteilung der korrekten Anzahl von Vermutungen unter der alternativen Hypothese folgt einer nicht zentralen hypergeometrischen Verteilung , die anhand des Quotenverhältnisses parametrisiert wird, dh wie viel höher sind die Quoten, dass die Dame "Tee zuerst" errät, wenn sie drin ist Tatsächlich wurde Tee zuerst hinzugefügt, im Gegensatz zu Milch, die zuerst hinzugefügt wurde (oder umgekehrt). Wenn das Odds Ratio 1 ist, erhalten wir die zentrale hypergeometrische Verteilung.

Mal sehen, ob das funktioniert. Ich werde R zur Veranschaulichung verwenden und das MCMCpackPaket verwenden, das die Funktion dnoncenhypergeom()zur Berechnung der Dichte einer (nicht zentralen) hypergeometrischen Verteilung hat. Es hat Argumente xfür die richtige Anzahl von Vermutungen (Achtung: dies ist die richtige Anzahl von Vermutungen unter einem der beiden Bedingungen, zum Beispiel, wenn Tee wirklich zuerst hinzugefügt wurde), Argumente n1, n2und m1für drei der vier Ränder und psifür das wahre Quotenverhältnis. Berechnen wir die Dichte für x0 bis 4 (mit allen Rändern gleich 4), wenn das wahre Quotenverhältnis 1 beträgt:

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

Dies ergibt:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

Es besteht also eine Wahrscheinlichkeit von 1,43%, dass die Dame unter der Nullhypothese 8 richtige Vermutungen anstellt (dh sie schätzt alle 4 Tassen richtig, wenn zuerst Tee hinzugefügt wurde, und daher errät sie auch alle 4 Tassen richtig, wenn zuerst Milch hinzugefügt wurde). Dies ist in der Tat die Menge an Beweisen, die Fisher als ausreichend erachtete, um die Nullhypothese abzulehnen.

(.90/(1.90))/(.10/(1.10))=81odds(guessA|trueA)/odds(guessA|trueB)). Wie hoch sind jetzt die Chancen, dass die Dame alle 8 Tassen richtig errät (dh alle 4 Tassen richtig errät, bei denen zuerst Tee hinzugefügt wurde, und daher auch die 4 Tassen, bei denen zuerst Milch hinzugefügt wurde)?

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

Dies ergibt:

[1] 0.8312221

Die Leistung beträgt also ungefähr 83%.

Wolfgang
quelle