Hintergrund: Ich habe einen Artikel gelesen, in dem Autoren die Pearson-Korrelation 0,754 aus Stichprobengröße 878 berichten. Der resultierende p-Wert für den Korrelationstest ist "zwei Sterne" signifikant (dh p <0,01). Ich denke jedoch, dass bei einer so großen Stichprobengröße der entsprechende p-Wert unter 0,001 liegen sollte (dh drei Sterne signifikant).
- Können p-Werte für diesen Test nur aus dem Pearson-Korrelationskoeffizienten und der Stichprobengröße berechnet werden?
- Wenn ja, wie geht das in R?
hypothesis-testing
correlation
p-value
fraud
Miroslav Sabo
quelle
quelle
Antworten:
Ja, dies ist möglich, wenn Sie die R-zu-Z-Transformation von Fisher verwenden. Andere Methoden (z. B. Bootstrap) können einige Vorteile haben, erfordern jedoch die Originaldaten. In R ( r ist der Probenkorrelationskoeffizient, n ist die Anzahl der Beobachtungen):
Siehe auch diesen Beitrag in meinem Blog .
Dabei spielt es keine Rolle, ob es sich um .01 oder .001 handelt. Wie Sie sagten, ist dies hauptsächlich eine Funktion des Stichprobenumfangs und Sie wissen bereits, dass der Stichprobenumfang groß ist. Die logische Schlussfolgerung ist, dass Sie wahrscheinlich überhaupt keinen Test benötigen (insbesondere keinen Test der sogenannten Null-Hypothese, dass die Korrelation 0 ist). Mit N = 878 können Sie sich auf die Genauigkeit der Schätzung verlassen und sich darauf konzentrieren, sie direkt zu interpretieren (dh, ist in Ihrem Bereich 0,75 groß?).
Wenn Sie jedoch einen statistischen Test im Neyman-Pearson-Framework durchführen, müssen Sie die Fehlerstufe im Voraus angeben. Wenn also die Testergebnisse wirklich wichtig sind und die Studie mit 0,01 als Schwellenwert geplant wurde, ist es nur sinnvoll, p <0,01 zu melden, und Sie sollten es nicht opportunistisch auf p <0,001 basierend auf dem erhaltenen p- Wert festlegen . Diese Art von nicht offengelegter Flexibilität ist sogar einer der Hauptgründe für die Kritik an kleinen Stars und allgemeiner für die Art und Weise, wie Nullhypothesen-Signifikanztests in den Sozialwissenschaften durchgeführt werden.
Siehe auch Meehl, PE (1978). Theoretische Risiken und tabellarische Sternchen: Sir Karl, Sir Ronald und der langsame Fortschritt der sanften Psychologie. Journal of Consulting and Clinical Psychology, 46 (4), 806-834. (Der Titel enthält einen Verweis auf diese „Sterne“, aber der Inhalt ist eine viel breitere Diskussion über die Rolle des Signifikanztests.)
quelle
Es gibt eine alternative Statistik:
das hat t-Verteilung mit n-2 Freiheitsgraden. So funktioniert das zum Beispiel: http://www.danielsoper.com/statcalc3/calc.aspx?id=44
quelle