In dem bekannten Experiment Fisher die beobachtbare ist die Anzahl der korrigierten erraten cup mit zwei Arten von Cup A und B . Normalerweise ist es interessant, den kritischen Bereich zu berechnen, um die Nullhypothese (die Dame schätzt zufällig) angesichts der Größe des Tests α abzulehnen . Dies ist mit der hypergeometrischen Verteilung leicht möglich. Auf die gleiche Weise kann ich die Größe des Tests für den kritischen Bereich berechnen.
Eine andere Frage ist: Wie berechnet man die Leistung des Tests bei einer alternativen Hypothese? Nehmen wir zum Beispiel an, dass die Dame mit der Wahrscheinlichkeit auf der einzelnen Tasse richtig raten kann ( P ( Vermutung A | wahr A ) = P ( Vermutung B | wahr B ) = 0,9 ). Was ist die Testkraft, wenn eine Gesamtzahl von Bechern gleich N = 8 und eine Gesamtzahl von Bechern einer Art n = N / 2 = 4 angenommen wird?? (Leider) weiß die Dame .
Mit anderen Worten gesagt: Wie ist die Verteilung von (Anzahl der richtigen Tassen unter der alternativen Hypothese), wenn die Dame weiß, dass es n Tassen einer Art gibt?
quelle
Antworten:
Unter der Alternative errät die Dame nicht zufällig, aber "nicht zufällig erraten" deckt eine Unendlichkeit verschiedener Situationen ab. Sie könnte immer perfekt raten oder sie könnte nur geringfügig besser raten als zufälliges Raten ... und im allgemeinen Fall gibt es nicht einmal eine einzelne Variable "Skala", die nicht zufällig bearbeitet werden kann (also haben wir nicht einmal eine Macht Kurve, es sei denn, wir beschränken die Art der nicht zufälligen Antworten, die sie geben könnte).
Um eine Potenz zu berechnen, müssen wir sehr genau wissen, wie sie nicht zufällig ist (und wie nicht zufällig sie auf diese bestimmte Weise ist).
Das ist eine bestimmte Art von Modell dafür, wie sie "besser als zufällig" abschneiden könnte, mit dem wir Parameter angeben und einen Wert für die Leistung erhalten könnten.
Wir könnten natürlich viele andere Formen der Nicht-Zufälligkeit als diese annehmen.
quelle
Die Verteilung der korrekten Anzahl von Vermutungen unter der alternativen Hypothese folgt einer nicht zentralen hypergeometrischen Verteilung , die anhand des Quotenverhältnisses parametrisiert wird, dh wie viel höher sind die Quoten, dass die Dame "Tee zuerst" errät, wenn sie drin ist Tatsächlich wurde Tee zuerst hinzugefügt, im Gegensatz zu Milch, die zuerst hinzugefügt wurde (oder umgekehrt). Wenn das Odds Ratio 1 ist, erhalten wir die zentrale hypergeometrische Verteilung.
Mal sehen, ob das funktioniert. Ich werde R zur Veranschaulichung verwenden und das
MCMCpack
Paket verwenden, das die Funktiondnoncenhypergeom()
zur Berechnung der Dichte einer (nicht zentralen) hypergeometrischen Verteilung hat. Es hat Argumentex
für die richtige Anzahl von Vermutungen (Achtung: dies ist die richtige Anzahl von Vermutungen unter einem der beiden Bedingungen, zum Beispiel, wenn Tee wirklich zuerst hinzugefügt wurde), Argumenten1
,n2
undm1
für drei der vier Ränder undpsi
für das wahre Quotenverhältnis. Berechnen wir die Dichte fürx
0 bis 4 (mit allen Rändern gleich 4), wenn das wahre Quotenverhältnis 1 beträgt:Dies ergibt:
Es besteht also eine Wahrscheinlichkeit von 1,43%, dass die Dame unter der Nullhypothese 8 richtige Vermutungen anstellt (dh sie schätzt alle 4 Tassen richtig, wenn zuerst Tee hinzugefügt wurde, und daher errät sie auch alle 4 Tassen richtig, wenn zuerst Milch hinzugefügt wurde). Dies ist in der Tat die Menge an Beweisen, die Fisher als ausreichend erachtete, um die Nullhypothese abzulehnen.
Dies ergibt:
Die Leistung beträgt also ungefähr 83%.
quelle