Unterschied zwischen einseitigem und zweiseitigem Testen?

13

Während des Studiums für meinen Statistikkurs habe ich versucht, den Unterschied zwischen einseitigen und zweiseitigen Hypothesentests zu verstehen. Warum lehnt der einseitige Test die Null ab, der zweiseitige nicht?

Ein Beispiel:

der Unterschied zwischen einseitigen und zweiseitigen Hypothesentests

Lu Ci
quelle
Beachten Sie, dass Sie nur mit einer bestimmten Signifikanzstufe ablehnen. Sie können beide Hypothesen dennoch ablehnen, indem Sie das Signifikanzniveau auf 10% erhöhen. Sie würden auch beides nicht ablehnen, wenn Sie das Signifikanzniveau auf 1% senken würden.
Wahrscheinlichkeit

Antworten:

11

Ein zweiseitiger Test prüft den Unterschied in beiden Richtungen. Somit wäre der P-Wert die Fläche unter der Verteilung t rechts von t = 1,92 zuzüglich der Fläche unter der Verteilung links von t = -1,92. Das ist doppelt so viel Fläche wie beim einseitigen Test, und der P-Wert ist doppelt so groß.

Wenn Sie einen One-Tailed-Test verwenden, gewinnen Sie an Leistung, müssen jedoch möglicherweise einen Unterschied ignorieren, der der Hypothese entgegengesetzt ist, die vor der Datenerfassung aufgestellt wurde. Wenn Sie die Daten erhalten haben, bevor Sie die Hypothese formalisiert und aufgezeichnet haben, sollten Sie wirklich einen zweiseitigen Test verwenden. Wenn Sie sich für einen Effekt in eine der beiden Richtungen interessieren, verwenden Sie ebenfalls einen zweiseitigen Test. In der Tat möchten Sie möglicherweise einen zweiseitigen Test als Standardmethode verwenden und nur einen einseitigen Test in dem ungewöhnlichen Fall, in dem ein Effekt nur in eine Richtung auftreten kann.

Michael Lew - Monica wieder einsetzen
quelle
Danke für deinen Kommentar, Michael. Folgendes verstehe ich nicht: Wie kann die Fläche unter der Kurve für den Test mit zwei Schwänzen doppelt so groß sein? Sollte P nicht in beiden Fällen gleich sein, da alpha = 0,05?
Lu Ci
In Ihrer Frage ist alpha nur Ihre Grenze, um eine Entscheidung darüber zu treffen, was p bedeutet (null ablehnen oder nicht). Es hat also keinen Einfluss auf den Wert von p.
John
Ein bisschen wählerisch, aber die Vorstellung, dass Sie die Hypothese auswählen müssen, bevor Sie die Daten sehen, ist nicht notwendig. Sie können zwei einseitige Tests durchführen. Sie werden immer die Richtung ablehnen, die von den Daten nicht bevorzugt wird. Daher ist es sinnvoll, den von den Daten favorisierten einseitigen Test zu wählen.
Wahrscheinlichkeitslogik
1
@probabilityislogic -Ich stimme vollkommen zu, außer wenn man möchte, dass der Alpha-Wert die tatsächliche langfristige falsch-positive Fehlerrate widerspiegelt (dh man möchte den Neyman-Pearson-Ansatz verwenden). Wenn Sie einen einseitigen Test verwenden und anhand des beobachteten Effekts entscheiden, in welche Richtung sich die Änderung ändern soll, erhalten Sie genau doppelt so viele falsch-positive Ergebnisse, wie Ihr Alpha-Level implizieren würde.
Michael Lew - Monica
Es ist nur die langfristige Fehlerrate für jemanden, der frühere Daten ignoriert. Dies ist kein guter Weg, um auf lange Sicht eine gute Leistung zu erzielen. die Fehlerrate von Bedeutung gegeben ist über alle Datensätze wir beobachtet haben könnten einmal .
Wahrscheinlichkeit
5

Die Fläche unter der Kurve ist bei einem zweiseitigen Test nicht doppelt so groß: Bei einem zweiseitigen Test mit kritischem p = 0,05 testen Sie, wie oft die beobachteten Daten aus unteren oder oberen 2,5% einer Nullverteilung gezogen werden konnten ( 0,05 insgesamt). Mit einem 1-Tail-Test testen Sie, wie oft die Daten von den extremen 5% des Schwanzes eines (vordefinierten) Schwanzes stammen würden.

Die Antwort auf Ihre Frage liegt zum Teil in der Praxis: Die meisten Forscher halten es für unwahrscheinlich, dass Experimente mit einseitigen Tests wiederholt werden.

Es gibt jedoch gültige Anwendungsfälle. Wenn Sie wissen, dass unter der getesteten Theorie kein Ergebnis in umgekehrter Richtung möglich ist, können Sie dies, wie bereits erwähnt, im Voraus festlegen und einen einseitigen Test durchführen. Die meisten Leute würden dies immer noch umsichtig sehen.

tim
quelle
0

S(D)RR , sodass wir den Nullwert ablehnen, wenn sich die Statistik in dem Bereich befindet. Jetzt wird das Signifikanzniveau als die Wahrscheinlichkeit berechnet, dass sich die Statistik im Ablehnungsbereich befindet, wenn die Null wahr ist.

S(D)=|t||t|>t0t0αS(D)=tt>t1 für passend gewählt t1. Jetzt werden wir immer habenPr(|t|>t0|H0)Pr(t>t0|H0). Um also die gleiche Bedeutung zu erlangen, müssen wir habent0t1.

Dies führt zu der Frage: Warum unterschiedliche Teststatistiken verwenden? Der Grund dafür ist, dass die Alternativen unterschiedlich sind und daher die Leistung jeder Teststatistik unterschiedlich ist. Insbesondere wird die Leistung jedes Tests reduziert (vorausgesetzt, wir verwenden dieselbe Signifikanz), wenn wir die Teststatistik und den Ablehnungsbereich des anderen Tests verwenden.

Wahrscheinlichkeitslogik
quelle