Während des Studiums für meinen Statistikkurs habe ich versucht, den Unterschied zwischen einseitigen und zweiseitigen Hypothesentests zu verstehen. Warum lehnt der einseitige Test die Null ab, der zweiseitige nicht?
Ein Beispiel:
hypothesis-testing
Lu Ci
quelle
quelle
Antworten:
Ein zweiseitiger Test prüft den Unterschied in beiden Richtungen. Somit wäre der P-Wert die Fläche unter der Verteilung t rechts von t = 1,92 zuzüglich der Fläche unter der Verteilung links von t = -1,92. Das ist doppelt so viel Fläche wie beim einseitigen Test, und der P-Wert ist doppelt so groß.
Wenn Sie einen One-Tailed-Test verwenden, gewinnen Sie an Leistung, müssen jedoch möglicherweise einen Unterschied ignorieren, der der Hypothese entgegengesetzt ist, die vor der Datenerfassung aufgestellt wurde. Wenn Sie die Daten erhalten haben, bevor Sie die Hypothese formalisiert und aufgezeichnet haben, sollten Sie wirklich einen zweiseitigen Test verwenden. Wenn Sie sich für einen Effekt in eine der beiden Richtungen interessieren, verwenden Sie ebenfalls einen zweiseitigen Test. In der Tat möchten Sie möglicherweise einen zweiseitigen Test als Standardmethode verwenden und nur einen einseitigen Test in dem ungewöhnlichen Fall, in dem ein Effekt nur in eine Richtung auftreten kann.
quelle
Die Fläche unter der Kurve ist bei einem zweiseitigen Test nicht doppelt so groß: Bei einem zweiseitigen Test mit kritischem p = 0,05 testen Sie, wie oft die beobachteten Daten aus unteren oder oberen 2,5% einer Nullverteilung gezogen werden konnten ( 0,05 insgesamt). Mit einem 1-Tail-Test testen Sie, wie oft die Daten von den extremen 5% des Schwanzes eines (vordefinierten) Schwanzes stammen würden.
Die Antwort auf Ihre Frage liegt zum Teil in der Praxis: Die meisten Forscher halten es für unwahrscheinlich, dass Experimente mit einseitigen Tests wiederholt werden.
Es gibt jedoch gültige Anwendungsfälle. Wenn Sie wissen, dass unter der getesteten Theorie kein Ergebnis in umgekehrter Richtung möglich ist, können Sie dies, wie bereits erwähnt, im Voraus festlegen und einen einseitigen Test durchführen. Die meisten Leute würden dies immer noch umsichtig sehen.
quelle
Dies führt zu der Frage: Warum unterschiedliche Teststatistiken verwenden? Der Grund dafür ist, dass die Alternativen unterschiedlich sind und daher die Leistung jeder Teststatistik unterschiedlich ist. Insbesondere wird die Leistung jedes Tests reduziert (vorausgesetzt, wir verwenden dieselbe Signifikanz), wenn wir die Teststatistik und den Ablehnungsbereich des anderen Tests verwenden.
quelle