Ist die Fehlerrate von Typ I gleich Alpha oder höchstens Alpha?

8

Laut der p-Wert-Wikipedia-Seite :

Wenn der p-Wert korrekt berechnet wird, garantiert dieser Test, dass die Fehlerrate vom Typ I höchstens beträgt .α

Jedoch weiter unten auf der Seite wird diese Formel:

Pr(RejectH|H)=Pr(pα|H)=α

Unter der Annahme, dass die Fehlerrate vom Typ 1 = Pr(RejectH|H) deutet dies darauf hin, dass die Fehlerrate vom Typ 1 α und nicht 'höchstens α ' ist. Andernfalls würde die Formel lauten:

Pr(RejectH|H)α

Wo ist mein Missverständnis?

Ei
quelle

Antworten:

8

Wenn die "Nullhypothese" mehr als einen Naturzustand enthält, kann die tatsächliche Falsch-Positiv-Rate (FPR) mit diesem Zustand variieren. Alles, was wir tun können, ist eine Begrenzung des FPR zu garantieren, egal wie dieser Naturzustand sein mag - aber wir können nicht immer garantieren, dass der FPR tatsächlich gleich .α

(Es gibt andere Gründe, warum der FPR möglicherweise nicht seinem Zielwert , z. B. wenn die Teststatistik diskret ist. Diese Situationen können normalerweise mithilfe randomisierter Entscheidungsverfahren behoben werden. Als solche bieten sie keinen grundlegenden Einblick in die Frage.)α


Betrachten Sie den klassischen einseitigen Test, bei dem angenommen wird, dass die Statistik eine Normalverteilung des unbekannten Mittelwerts und (der Einfachheit halber) der bekannten Standardabweichung . ist mit zu vergleichen . Die Nullhypothese lautet während die alternative Hypothese lautet . Der Ablehnungsbereich hat daher die FormXμσμ0H0:μ0HA:μ<0

R(α)=(,Zα]

Dabei wird so gewählt, dass die Wahrscheinlichkeit, eine Statistik in dieser Region zu beobachten, höchstens beträgt :Zα α

(1)α=sup(Pr(XR(α))).

Unter den Annahmen ist diese Wahrscheinlichkeit durch die Normalverteilungsfunktion :Φ

(2)Pr(XR(α))=Φ(Zαμσ).

Diese Wahrscheinlichkeit hängt vom unbekannten Wert von . μ Daher können wir nicht garantieren, dass es tatsächlich . Tatsächlich für große , ist praktisch gleich Null. Wir müssen jedoch alle unsere Basen abdecken und garantieren, dass die falsch-positive Rate nicht überschreitet , solange mit der Nullhypothese übereinstimmt . αμ(2)μ(1)α

whuber
quelle
1
@ JackPierce-Brown Die Formel ist korrekt für die Punkt-Null-Hypothese und für die kontinuierliche Teststatistik. Das muss im Wikipedia-Artikel angenommen werden, wird aber wahrscheinlich nicht dargelegt. (+1)
Amöbe
1
@ Amöbe ist richtig. Beachten Sie außerdem, dass nur wenige praktische Tests tatsächlich Punkt-Null-Hypothesen beinhalten. Selbst der klassische Student-t-Test von vs ist kein Punkt Null, da es vielfältige Möglichkeiten für den unbekannten Wert des Parameters , obwohl die Null den Wert von . H0:μ=0 HA:μ>0σμ
whuber
1
@whuber Hmm, dein T-Test-Beispiel ist rätselhaft. Können Sie das näher erläutern? Ich dachte, ist ein Punkt Null, weil ein Punkt ist und nicht in die Nullhypothese eingeht. Wenn es sich nicht um einen Punkt Null handelt, bedeutet dies, dass die Fehlerrate von Typ I nicht gleich ? Ich hätte gedacht, es sollte gleich egal was ist. H0=00σαασ
Amöbe
2
@Amoeba sehr viel Teil der Nullhypothese. Streng genommen ist der ParameterraumDie Nullhypothese ist die TeilmengeEs ist kein einziger Naturzustand. Aber vielleicht ist dies nicht das beste Beispiel, weil die Verteilung der - Statistik nicht davon abhängt : das ist , warum eine Konstante FPR möglich ist. σ
Θ={(μ,σ)μR,σ0}.
H0={(μ,σ)μ=0,σ0}Θ.
tσ
whuber
1
Interessant. Aha.
Amöbe
4

Es ist ein hinterhältiges Problem. Wenn Sie kontinuierliche Daten haben und diese angemessen behandeln, ist . Wenn Ihre Daten jedoch diskret sind, ist möglicherweise nicht möglich . Betrachten Sie Binomialdaten darüber, ob eine Münze fair ist. Mit 5 Münzwürfen sind die möglichen einseitigen p-Werte: Pr(pα|H0)=αp=α

> pbinom(0:5, size=5, prob=.5)
[1] 0.03125 0.18750 0.50000 0.81250 0.96875 1.00000

Nur Köpfe könnten einen Fehler vom Typ I ergeben, und die damit verbundene Wahrscheinlichkeit beträgt . So wird der Typ - I - Fehlerrate würde auf „höchstens gehalten werden “, aber nicht zu gleich . 00.03α α

Andererseits gibt es (ungültige) Analysestrategien, die zu Fehlerraten vom Typ I führen, die größer als , selbst wenn (z. B. schrittweise Auswahlroutinen). αp<α

Ich habe hier eine ausführlichere Diskussion: Vergleichen und Gegenüberstellen, p-Werte, Signifikanzniveaus und Fehler vom Typ I.

gung - Monica wieder einsetzen
quelle