Bei einem üblichen t-Test der Mittelwerte unter Verwendung der üblichen Hypothesentestmethoden lehnen wir entweder die Null ab oder lehnen die Null nicht ab, akzeptieren jedoch niemals die Null. Ein Grund dafür ist, dass, wenn wir mehr Beweise erhalten würden, dieselbe Effektgröße signifikant werden würde.
Aber was passiert bei einem Nicht-Minderwertigkeitstest?
Das ist:
vs.
wobei eine Menge ist, die wir als im Wesentlichen gleich betrachten. Wenn wir also die Null ablehnen, sagen wir, dass um mindestens größer als . Wir können die Null nicht ablehnen, wenn es nicht genügend Beweise gibt.
Wenn die Effektgröße oder größer ist, ist dies analog zum regulären t-Test. Aber was ist, wenn die Effektgröße in dem Beispiel, das wir haben, kleiner als ist? Wenn wir dann die Stichprobengröße erhöhen und den gleichen Effekt beibehalten würden, würde dies nicht signifikant bleiben. Können wir daher in diesem Fall die Null akzeptieren?
quelle
Antworten:
Ihre Logik gilt genauso für die guten alten einseitigen Tests (dh mit ), die den Lesern möglicherweise besser bekannt sind. Stellen Sie sich der vor , wir testen die Null gegen die Alternative, dass positiv ist. Wenn dann true negativ ist, führt eine Erhöhung der Stichprobengröße nicht zu einem signifikanten Ergebnis, dh um Ihre Worte zu verwenden, ist es nicht wahr, dass "wenn wir mehr Beweise erhalten würden, würde dieselbe Effektgröße signifikant werden".x=0 H0:μ≤0 μ μ
Wenn wir testen , können wir drei mögliche Ergebnisse erzielen:H0:μ≤0
Erstens kann das Konfidenzintervall vollständig über Null liegen; dann lehnen wir die Null ab und akzeptieren die Alternative (dass positiv ist).(1−α)⋅100% μ
Zweitens kann das Konfidenzintervall vollständig unter Null liegen. In diesem Fall lehnen wir die Null nicht ab. In diesem Fall denke ich jedoch, dass es in Ordnung ist zu sagen, dass wir "die Null akzeptieren", weil wir als eine weitere Null betrachten und diese ablehnen könnten .H1
Drittens kann das Konfidenzintervall Null enthalten. Dann können wir nicht ablehnen und wir können auch nicht ablehnen , also gibt es nichts zu akzeptieren.H0 H1
Ich würde also sagen, dass man in einseitigen Situationen die Null akzeptieren kann, ja. Aber wir können es nicht einfach akzeptieren, weil wir es nicht abgelehnt haben; Es gibt drei Möglichkeiten, nicht zwei.
(Genau das Gleiche gilt für Äquivalenztests, auch bekannt als "zweiseitige Tests" (TOST), Nicht-Minderwertigkeitstests usw. Man kann die Null ablehnen, die Null akzeptieren oder ein nicht schlüssiges Ergebnis erhalten.)
Wenn ein Punkt Null wie , können wir ihn niemals akzeptieren, da keine gültige Nullhypothese darstellt.H0 H0:μ=0 H1:μ≠0
(Es sei denn, kann nur diskrete Werte haben, z. B. muss eine Ganzzahl sein. Dann scheint es, dass wir akzeptieren könnten, da jetzt eine gültige Null darstellt Hypothese. Dies ist jedoch ein Sonderfall.)μ H0:μ=0 H1:μ∈Z,μ≠0
Dieses Problem wurde vor einiger Zeit in den Kommentaren unter @ gungs Antwort hier diskutiert: Warum sagen Statistiker, dass ein nicht signifikantes Ergebnis bedeutet, dass Sie die Null nicht ablehnen können, anstatt die Nullhypothese zu akzeptieren?
Siehe auch einen interessanten (und unterbewerteten) Thread. Bedeutet das Versäumnis, die Null im Neyman-Pearson-Ansatz abzulehnen, dass man sie "akzeptieren" sollte? , wo @Scortchi erklärt, dass einige Autoren im Neyman-Pearson-Framework kein Problem damit haben, über das "Akzeptieren der Null" zu sprechen. Das bedeutet auch @Alexis im letzten Absatz ihrer Antwort hier.
quelle
Wir "akzeptieren niemals die Nullhypothese" (ohne auch die Leistung und die minimale relevante Effektgröße zu berücksichtigen). Mit einem einzelnen Hypothesentest stellen wir einen Naturzustand und beantworten dann eine Variation der Frage "Wie unwahrscheinlich ist es, dass wir die unserer Teststatistik zugrunde liegenden Daten unter der Annahme von (und unserer Verteilung) beobachtet haben Annahme) ist wahr? " Wir werden dann unsere basierend auf einer bevorzugten Fehlerrate vom Typ I ablehnen oder nicht ablehnen und eine Schlussfolgerung ziehen, die sich immer auf bezieht. Das heißt, wir haben Beweise gefunden, um auf , oder wir haben es getan keine Beweise finden, um . Wir akzeptieren kein H 0 H 0 H A H A H A H 0H0 H0 H0 HA HA HA H0 weil wir nicht nach Beweisen dafür gesucht haben. Das Fehlen von Beweisen (z. B. eines Unterschieds) ist nicht dasselbe wie das Fehlen von Beweisen (z. B. eines Unterschieds). .
Dies gilt für einseitige Tests ebenso wie für zweiseitige Tests: Wir suchen nur nach Beweisen für und finden sie oder finden sie nicht.HA
Wenn wir nur ein einziges (ohne sowohl die minimale relevante Effektgröße als auch die statistische Aussagekraft ernsthaft zu berücksichtigen), verpflichten wir uns a priori zur Bestätigungsverzerrung , da wir nicht nach Beweisen für gesucht haben , nur Beweise für . Natürlich können (und sollten wir sagen ) Nullhypothesen für und gegen eine Position aufstellen ( Relevanztests , die Differenztests ( ) mit Äquivalenztests ( kombinieren ) ) mach genau das). H 0 H A H + 0 H - 0H0 H0 HA H+0 H−0
Es scheint mir , dass es keinen Grund gibt , warum Sie nicht Folgerung aus einem einseitigen Test kombinieren kann für Minderwertigkeit mit einem einseitigen Test für Nicht-Unterlegenheit den Nachweis zu erbringen (oder Mangel an Beweisen) in beide Richtungen gleichzeitig.
Natürlich, wenn man die Leistung und die Effektgröße berücksichtigt und nicht ablehnt , aber weiß, dass es (a) eine minimale relevante Effektgröße gibt und (b) dass ihre Daten leistungsfähig genug sind, um erkannt zu werden Wenn es für einen bestimmten Test gilt, kann man dies als Beweis für interpretieren . δ H 0H0 δ H0
quelle