Dies ist eindeutig nur eine Frage der Definition oder Konvention und hat praktisch kaum Bedeutung. Wenn auf seinen traditionellen Wert von 0,05 eingestellt ist, wird ein Wert von 0,0500000000000 als statistisch signifikant angesehen oder nicht? Wird die Regel zur Definition der statistischen Signifikanz normalerweise als oder ?p < α p ≤ α
hypothesis-testing
statistical-significance
definition
Harvey Motulsky
quelle
quelle
Antworten:
Unter Berufung auf Lehmann und Romano, Prüfung statistischer Hypothesen, . Wenn wir S 1 als Bereich der Zurückweisung und Ω H als Bereich der Nullhypothese definieren, haben wir die folgende Aussage, p. 57 in meiner Kopie:≤ S1 ΩH
Da es möglich ist, dass , folgt, dass Sie für p-Werte ≤ α ablehnen würden .Pθ{X∈S1}=α ≤α
Stellen Sie sich auf einer intuitiveren Ebene einen Test in einem diskreten Parameterraum und einen besten (leistungsstärksten) Zurückweisungsbereich mit einer Wahrscheinlichkeit von genau 0,05 unter der Nullhypothese vor. Angenommen, der nächstgrößte (in Bezug auf die Wahrscheinlichkeit) beste Zurückweisungsbereich hatte eine Wahrscheinlichkeit von 0,001 unter der Nullhypothese. Es wäre schwierig zu rechtfertigen, wieder intuitiv zu sagen, dass die erste Region nicht einer Entscheidung mit einem Vertrauensgrad von 95% entspricht, sondern dass Sie die zweite Region verwenden müssen, um 95% zu erreichen. Vertrauensniveau.
quelle
Sie haben ein interessantes und etwas kontroverses Thema angesprochen. Dies kann humorvoll durch dieses Bild zusammengefasst werden (auf Andrew Gelmans Blog zu finden, aber ursprünglich mit freundlicher Genehmigung von Dan Goldstein ):
Erstens ist .05 nichts Magisches. Solange Sie Ihren Schwellenwert im Voraus auswählen, kann ein Schwellenwert von 0,1 oder 0,01 genauso sinnvoll sein. Zu diesem Zweck wäre es ebenso gerechtfertigt , entweder zu wählen, dass Sie einen Cutoff von oder ≤ 0,05 verwenden möchten, vorausgesetzt, Sie haben nicht geschummelt, indem Sie Ihren Cutoff geändert, nachdem Sie Ihren p-Wert beobachtet haben.<.05 ≤.05
Wenn Sie dies im engsten Sinne betrachten wollen, dann würden Sie, wenn Sie vorher einen Cutoff von (was meiner Meinung nach mehr "Standard" ist) wählen und beobachten, dass p genau gleich .05 ist, technisch gesehen betrügen unter Standard-Frequentist-Techniken. Aber darin liegt ein Teil des Problems mit diesem ganzen Ansatz. Wir machen ein binäres Problem "statistisch signifikant oder nicht" aus etwas, das überhaupt kein binäres Problem ist. Wie Andrew Gelman und Hal Stern treffend sagten : "Der Unterschied zwischen" signifikant "und" nicht signifikant "ist selbst statistisch nicht signifikant."<.05
quelle