Wenn die "Nullhypothese" mehr als einen Naturzustand enthält, kann die tatsächliche Falsch-Positiv-Rate (FPR) mit diesem Zustand variieren. Alles, was wir tun können, ist eine Begrenzung des FPR zu garantieren, egal wie dieser Naturzustand sein mag - aber wir können nicht immer garantieren, dass der FPR tatsächlich gleich .α
(Es gibt andere Gründe, warum der FPR möglicherweise nicht seinem Zielwert , z. B. wenn die Teststatistik diskret ist. Diese Situationen können normalerweise mithilfe randomisierter Entscheidungsverfahren behoben werden. Als solche bieten sie keinen grundlegenden Einblick in die Frage.)α
Betrachten Sie den klassischen einseitigen Test, bei dem angenommen wird, dass die Statistik eine Normalverteilung des unbekannten Mittelwerts und (der Einfachheit halber) der bekannten Standardabweichung . ist mit zu vergleichen . Die Nullhypothese lautet während die alternative Hypothese lautet . Der Ablehnungsbereich hat daher die FormXμσμ0H0:μ≥0HA:μ<0
R(α)=(−∞,Zα]
Dabei wird so gewählt, dass die Wahrscheinlichkeit, eine Statistik in dieser Region zu beobachten, höchstens beträgt :Zα α
α=sup(Pr(X∈R(α))).(1)
Unter den Annahmen ist diese Wahrscheinlichkeit durch die Normalverteilungsfunktion :Φ
Pr(X∈R(α))=Φ(Zα−μσ).(2)
Diese Wahrscheinlichkeit hängt vom unbekannten Wert von . μ Daher können wir nicht garantieren, dass es tatsächlich . Tatsächlich für große , ist praktisch gleich Null. Wir müssen jedoch alle unsere Basen abdecken und garantieren, dass die falsch-positive Rate nicht überschreitet , solange mit der Nullhypothese übereinstimmt . αμ(2)μ(1)α
Es ist ein hinterhältiges Problem. Wenn Sie kontinuierliche Daten haben und diese angemessen behandeln, ist . Wenn Ihre Daten jedoch diskret sind, ist möglicherweise nicht möglich . Betrachten Sie Binomialdaten darüber, ob eine Münze fair ist. Mit 5 Münzwürfen sind die möglichen einseitigen p-Werte:Pr(p≤α|H0)=α p=α
Nur Köpfe könnten einen Fehler vom Typ I ergeben, und die damit verbundene Wahrscheinlichkeit beträgt . So wird der Typ - I - Fehlerrate würde auf „höchstens gehalten werden “, aber nicht zu gleich .0 ≈0.03 α α
Andererseits gibt es (ungültige) Analysestrategien, die zu Fehlerraten vom Typ I führen, die größer als , selbst wenn (z. B. schrittweise Auswahlroutinen).α p<α
Ich habe hier eine ausführlichere Diskussion: Vergleichen und Gegenüberstellen, p-Werte, Signifikanzniveaus und Fehler vom Typ I.
quelle