Als Konvention haben wir viele Studien, deren Signifikanzniveau ist und eine Potenz von . Es ist jedoch äußerst selten, eine Studie zu finden, deren mit einer Potenz von .
Nach meinem Verständnis spielt das Signifikanzniveau nach Durchführung eines Experiments überhaupt keine Rolle, wenn das Ergebnis nicht signifikant ist, da wir in diesem Fall überlegen, ob es sinnvoll ist, die Null zu akzeptieren, und alles, was uns wichtig ist ist die Kraft. Wenn das Ergebnis signifikant ist, wird das Signifikanzniveau zu Ihrem Beweis, während die Leistung des Tests absolut keinen Unterschied macht. (Mit "spielt keine Rolle" meine ich "nicht für den Zweck dieses Experiments". Sowohl das Signifikanzniveau als auch die Aussagekraft sollten für Metastudien wichtig sein. Bitte geben Sie beide in Ihrer Publikation an!)
Wenn ich richtig liege, sind die Null und die Alternative bis zu einem gewissen Grad symmetrisch: Die Nullhypothese erfordert von Natur aus keinen weiteren Schutz. Wenn Sie die Alternative beweisen möchten, sagen Sie "dieses neue Medikament hat eine Wirkung auf die Patienten", dann verwenden Sie ein sehr kleines und eine mäßig hohe Leistung. Wenn Sie andererseits die Null beweisen möchten, beispielsweise in einem Normalitätstest, sollten Sie ein mäßig kleines und eine sehr hohe Leistung wählen , damit Sie die Null vertraulich akzeptieren können.
Warum sind Experimente mit mäßig kleinem und sehr hoher Leistung so selten?
Antworten:
Das ist alles ein bisschen relativ, aber man könnte sicherlich argumentieren, dass das Signifikanzniveauα=0.05 ist bereits schwach und stellt bereits ein Opfer dar, das für eine höhere Macht gebracht wurde (z. B. relativ zum Signifikanzniveau) α=0.01 oder andere niedrigere Signifikanzniveaus). Obwohl die Meinungen dazu unterschiedlich sein werden, ist meine eigene Ansicht, dass dies bereits ein sehr schwaches Signifikanzniveau ist, so dass die Wahl überhaupt ein Kompromiss ist, um eine höhere Leistung zu erzielen.
Ich kann sehen, warum Sie das vielleicht denken, aber es ist nicht wirklich wahr. Beim klassischen Testen von Hypothesen gibt es eine ziemlich komplexe und subtile Wechselwirkung in diesen Dingen. Denken Sie daran, dass sowohl der p-Wert als auch die Potenz Wahrscheinlichkeiten betreffen, die vom wahren Zustand der Hypothesen abhängen (die p-Wert-Bedingungen für die Null und die Potenzbedingungen für die Alternative). Wenn Sie Ihr Ergebnis aus den Daten erhalten, schließen Sie auf die Hypothesen, kennen aber immer noch nicht ihren wahren Zustand. Daher ist es nicht wirklich legitim zu sagen, dass Sie die "andere Hälfte" des Tests vollständig ignorieren können. Unabhängig davon, ob das Ergebnis statistisch signifikant ist oder nicht, erfolgt die Interpretation dieses Ergebnisses in Bezug auf alle Eigenschaften des Tests ganzheitlich.
Es ist auch erwähnenswert, dass für ein festes Modell und einen Test sowie eine feste Stichprobengröße die Potenzfunktion eine Funktion des gewählten Signifikanzniveaus ist. Das gewählte Signifikanzniveau bestimmt den Ablehnungsbereich, der sich direkt auf die Leistung des Tests auswirkt. Es gibt also wieder eine Beziehung zwischen diesen Dingen, und Sie können "die Hälfte" der Eigenschaften des Tests nicht ignorieren.
quelle
Dies ist eher ein erweiterter Kommentar als eine Antwort. Eine interessante Perspektive findet sich in diesem Blog-Beitrag , ein kurzes Zitat:
Wenn dies richtig ist, kann Fisher mit etwas Bedeutendem gemeint haben, das es wert ist, notiert zu werden (mental oder im Labor), das für weitere Untersuchungen oder Replikationen würdig ist.
Dieses psyarxive Papier, das vorschlägt, das Standard-Signifikanzniveau (in der Psychologieforschung) von 0,05 auf 0,005 zu senken, ist ein weiterer Beweis dafür, dass viele (zu Recht ...) sehen, dass 0,05 bereits eine eher schwache Anforderung ist.
quelle
Weil Fehler vom Typ II als weniger problematisch angesehen werden als Fehler vom Typ I. Fehler vom Typ I haben größere Auswirkungen auf die zukünftige Forschung. Darüber hinaus sind Experimente mit hoher Leistung meistens viel teurer.
Natürlich können Sie auch das gesamte NHST-Framework in Frage stellen und die Art und Weise, wie es häufig von ahnungslosen Forschern missbraucht wird ...
quelle