In einem Wilcoxon-Signed-Ranks-Test zur statistischen Signifikanz stießen wir auf einige Daten, die einen von . Reicht dieses Ergebnis bei einem Schwellenwert von aus, um die Nullhypothese zu verwerfen, oder ist es sicherer zu sagen, dass der Test nicht schlüssig war, da er, wenn wir den p-Wert auf 3 Dezimalstellen runden, zu ?0,04993 p < 0,05 0,050
hypothesis-testing
statistical-significance
p-value
Islam El-Nabarawy
quelle
quelle
Antworten:
Hier gibt es zwei Probleme:
1) Was ist die formale Ablehnungsregel, wenn Sie einen formalen Hypothesentest durchführen (und wenn Sie bereits einen p-Wert in meinem Buch angeben) ?
Beim Vergleich der Teststatistik mit kritischen Werten liegt der kritische Wert im Ablehnungsbereich . Während diese Formalität nicht viel ausmacht, wenn alles kontinuierlich ist, spielt es eine Rolle, wenn die Verteilung der Teststatistik diskret ist.
Dementsprechend lautet die Regel beim Vergleich von p-Werten und Signifikanzniveaus:
Bitte beachten Sie, dass Sie auch dann, wenn Sie Ihren p-Wert auf 0,05 aufrunden, formal sogar dann ablehnen sollten, wenn der Wert exakt 0,05 betrug .p
2) In Bezug auf "Was sagt uns unser p-Wert", wenn Sie dann annehmen, dass Sie einen p-Wert sogar als "Beweis gegen die Null" interpretieren können (sagen wir, dass die Meinung dazu etwas geteilt ist), sind 0,0499 und 0,0501 dies nicht wirklich verschiedene Dinge über die Daten zu sagen (Effektgrößen würden dazu neigen, fast identisch zu sein).
Mein Vorschlag wäre, (1) die Null formal abzulehnen und vielleicht darauf hinzuweisen, dass sie auch dann abgelehnt werden sollte, wenn sie genau 0,05 wäre; (2) zur Kenntnis , dass es nichts besonders speziell etwa und es ist sehr nahe an diese Grenze - auch eine etwas kleinere Signifikanzschwelle nicht zu Ablehnung führen.α = 0,05
quelle
Es liegt im Auge des Betrachters.
Es läuft also wirklich auf das hinaus, was AlefSin zuvor kommentiert hat. Es kann keine "richtige Antwort" auf Ihre Frage geben. Berichten Sie, was Sie haben, gerundet oder nicht.
Es gibt eine riesige Literatur über die "Bedeutung der Bedeutung"; siehe zum Beispiel den kürzlich erschienenen Aufsatz eines der führenden deutschen Statistiker, Walter Krämer, zum Thema "Der Kult von statistischer Bedeutung - Was Ökonomen tun sollten und was nicht, um ihre Daten zum Sprechen zu bringen", Schmollers Jahrbuch 131 , 455-468, 2011.
quelle
Das Hauptproblem ist dieser Satz: "Wir sind auf einige Daten gestoßen ...".
Es gibt einen Namen für diese Art von statistischem Fehlverhalten: das Ausbaggern von Daten . Ich bin ambivalent, wenn es darum geht, es in der Zeitung als interessante Hypothese zu beschreiben. Hat es einen physischen Grund, den Sie für wahrscheinlich halten?
Es gibt jedoch einen Ausweg. Vielleicht haben Sie sich a priori entschieden , nur diesen einen Test mit nur diesem einen Datensatz durchzuführen . Sie haben das in Ihr Laborbuch geschrieben, damit Sie es später nachweisen können. Dann hast du deinen Test gemacht.
quelle