Ich wurde von einem Rezensenten gefragt, ob die in einer Tabelle dargestellten Pearson-Korrelationen (r-Werte) miteinander verglichen werden können, damit man behaupten kann, dass einer "stärker" als der andere ist (außer nur die tatsächlichen r-Werte zu betrachten). .
Wie würden Sie das machen? Ich habe diese Methode gefunden
http://vassarstats.net/rdiff.html
bin mir aber nicht sicher, ob dies zutrifft.
correlation
pearson-r
method-comparison
Pecorino
quelle
quelle
Antworten:
(Ich nehme an, Sie sprechen von Rs , die aus einer Probe stammen.)
Der Test auf dieser Website gilt in dem Sinne, dass er r wie jeden Parameter behandelt, dessen Wert zwischen zwei Populationen unterschiedlich sein kann. Wie unterscheidet sich r von anderen Messwerten wie dem Mittelwert, den Sie mit dem t- Test sehr sicher vergleichen können ? Nun, es ist insofern anders, als es zwischen -1,1 gebunden ist, es hat nicht die richtige Verteilung, also müssen Sie es vor der Inferenz nach Fisher transformieren (und danach nachträglich transformieren, wenn Sie zB ein CI erhalten möchten). Die aus dem Test resultierenden z-Werte haben die richtige Form, um Rückschlüsse zu ziehen. Das ist der Test, mit dem Sie verknüpfen.
Was Sie also verknüpfen, ist ein Verfahren, mit dem Sie ableiten können, was passieren könnte, wenn Sie das r für die gesamte Population (en) erhalten könnten, aus der Sie eine Stichprobe erstellen - wäre das r für eine Gruppe höher als für die andere oder wäre es sie sind genau gleich? Nennen wir diese spätere Hypothese H . Wenn der Test einen niedrigen p- Wert zurückgibt , bedeutet dies, dass Sie basierend auf Ihrer Stichprobe wenig Vertrauen in die Hypothese haben sollten, dass der wahre Wert für die Differenz zwischen den beiden Rs genau 0 wäre (da solche Daten selten auftreten würden, wenn der Unterschied in r war genau 0). Wenn nicht, haben Sie nicht die Daten, um diese Hypothese von genau gleichem Vertrauen mit Sicherheit abzulehnen0 r , entweder weil es wahr ist und / oder weil Ihre Stichprobe nicht ausreicht. Beachten Sie, dass ich die gleiche Geschichte über den Unterschied in den Mitteln (unter Verwendung des t- Tests) oder eine andere Maßnahme hätte machen können.
Eine ganz andere Frage ist, ob der Unterschied zwischen den beiden sinnvoll wäre . Leider gibt es keine direkte Antwort darauf, und kein statistischer Test kann Ihnen die Antwort geben. Vielleicht ist der wahre Wert (der Bevölkerungswert, nicht der, den Sie beobachten) von r 0,5 in einer und 0,47 in der anderen Gruppe. In diesem Fall wäre die statistische Hypothese ihrer Äquivalenz (unser H ) falsch. Aber ist das ein bedeutender Unterschied? Es kommt darauf an - ist etwas in der Größenordnung von 3% mehr erklärter Varianz sinnvoll oder bedeutungslos? Cohen hat grobe Richtlinien für die Interpretation von r gegeben (und vermutlich Unterschiede zwischen r0 's), aber nur unter dem Rat, dass dies nichts als ein Ausgangspunkt ist. Und Sie kennen nicht einmal den genauen Unterschied, selbst wenn Sie eine Schlussfolgerung ziehen, z. B. indem Sie den CI für die Unterschiede zwischen den beiden Korrelationen berechnen. Höchstwahrscheinlich sind eine Reihe möglicher Unterschiede mit Ihren Daten kompatibel.
Eine vergleichsweise sichere Wette wäre, die Konfidenzintervalle für Ihre Rs und möglicherweise die CI für deren Differenz zu berechnen und den Leser entscheiden zu lassen.
quelle