Warum werden Typ-II-Fehler beim Testen von Hypothesen als Fehler angesehen?

8

Ich lese über Entscheidungsfehler beim Testen von Hypothesen. Meine Frage ist, warum ein "Typ-II-Fehler" überhaupt als Fehler angesehen wird. Soweit ich weiß, entsteht dies, wenn wir eine falsche Nullhypothese nicht ablehnen. Wenn wir die Nullhypothese nicht ablehnen, bedeutet dies einfach, dass wir keine starken Beweise haben, um sie abzulehnen. Wir machen keinen Kommentar darüber, welche der beiden Hypothesen wahr (oder falsch) ist - beides kann auch wahr sein. Wir sagen nicht, dass die Nullhypothese wahr ist. Warum wird eine solche Schlussfolgerung daher als Fehler bezeichnet?

Sanket Kedia
quelle

Antworten:

5

Das liegt daran, dass wir nicht das tun, was wir tun sollen, wenn die alternative Hypothese wahr ist. Zum Beispiel verwenden wir nicht das neue Medikament, das tatsächlich besser ist als das bestehende, aber wir konnten es nicht beweisen.

Zahava Kor
quelle
Nach dieser Logik sollte es nicht wirklich positiv sein, eine echte Nullhypothese nicht abzulehnen. Es sollte ein Fehler sein, weil wir nicht das tun, was wir tun sollen, wenn die Nullhypothese wahr ist.
Sanket Kedia
1
Warum sagst du das? Natürlich tun wir das, was wir tun sollen, wenn die Nullhypothese wahr ist - wir bleiben beim aktuellen Verhalten, was unter Ihrer Annahme, dass die Nullhypothese wahr ist, richtig ist.
Zahava Kor
Die Verbindung von NHST mit den Aktionen , die normalerweise stattfinden, wie es Zahava Kor hier tut, scheint der einfachste und direkteste Weg zu sein, Fehler vom Typ II als "Fehler" zu bewerten . In einigen Kontexten, wie beispielsweise der von Zahava Kor speziell zitierten Arzneimittelentwicklung, ist das NHST in einen Aktionsplan eingebettet, sodass das epistemische Ergebnis des Tests die Aktionen bestimmt. Im Zusammenhang mit der Medizin im Allgemeinen hilft es, Braithwaites großartiges EBM Six Dangerous Words JAMA
David C. Norris
4

Wie wir das Wort "Fehler" verwenden wollen, ist letztendlich eine semantische Frage, und vernünftige Leute könnten sich nicht darüber einig sein, ob und in welchem ​​Sinne wir ein falsches Negativ als Fehler betrachten sollten .

  • Einerseits denke ich, dass Sie Recht haben, dass ein nicht signifikantes Ergebnis wirklich nur bedeutet, dass wir nicht genügend Informationen haben, um sicher zu sein, dass die Nullhypothese falsch ist, und dass dies nicht logisch impliziert, dass die Nullhypothese wahr ist ( Vgl. Warum sagen Statistiker, dass ein nicht signifikantes Ergebnis bedeutet, dass Sie die Null nicht ablehnen können, anstatt die Nullhypothese zu akzeptieren? ). Angesichts des Vertrauens, das Sie in Ihre Situation gefordert haben, und der Mehrdeutigkeit Ihrer Daten haben Sie die richtige Entscheidung getroffen, indem Sie die von Ihnen festgelegte Regel korrekt angewendet haben.
  • Auf der anderen Seite, wenn Sie sich in die Position eines Menschen versetzen, der ein Studium plant. Sie wollen wissen, ob die Null falsch ist. Wenn es wirklich falsch ist, wollen sie nach Abschluss der Studie weggehen, nachdem sie die Nullhypothese zurückgewiesen haben. Stattdessen würden sie über das Problem unklar bleiben und müssten möglicherweise eine weitere Studie entwerfen und durchführen. Aus dieser Perspektive ist es definitiv ein suboptimales Ergebnis, eine falsche Null nicht abzulehnen.
gung - Monica wieder einsetzen
quelle
3
+1. Aber es könnte angebracht sein, das Thema Fisher vs Neyman-Pearson hier anzusprechen (ich werde auf Ihre eigene nette Antwort darauf verweisen : stats.stackexchange.com/questions/23142 ). OP stellt die Frage in einem scheinbar fischerischen Paradigma. Der Typ-II-Fehler ist jedoch ein Konzept aus dem Neyman-Pearson-Paradigma. Daher glaube ich, dass OP verwirrt ist.
Amöbe
1

Das Wort "Fehler" steht in der Nähe von "Fehler".

Für mich ist der Begriff Fehler sinnvoll, da Sie eine Wahrscheinlichkeit für das Auftreten berechnen können (vorausgesetzt, Sie legen eine bestimmte minimale Effektgröße fest, deren Erkennung wünschenswert wäre). Und Sie möchten diese Wahrscheinlichkeit in Situationen berechnen, in denen sie klein sein soll. In diesen Situationen wird der Fehler als Fehler angesehen.

Für mich ist es sehr symmetrisch mit Fehlern vom Typ I.

Wie bei p-Werten, die sich auf Fehler vom Typ I beziehen, können Sie auch die Wahrscheinlichkeit berechnen, dass die Nullhypothese (fälschlicherweise) nicht verworfen wird. Für eine bestimmte Effektgröße und einen bestimmten Test (z. B. Anzahl der Messungen) können Sie berechnen, mit welcher Wahrscheinlichkeit dieser „Fehler“ auftreten kann.

Diese Gedanken haben verlangen , dass Sie eine Grenze für die Nullhypothese festgelegt.

pαH.0

Sextus Empiricus
quelle
1
Tatsächlich besteht der eigentliche Fehler darin, Hypothesentests durchzuführen.
Sextus Empiricus