Wie kann man die Stärke zweier Pearson-Korrelationen vergleichen?

10

Ich wurde von einem Rezensenten gefragt, ob die in einer Tabelle dargestellten Pearson-Korrelationen (r-Werte) miteinander verglichen werden können, damit man behaupten kann, dass einer "stärker" als der andere ist (außer nur die tatsächlichen r-Werte zu betrachten). .

Wie würden Sie das machen? Ich habe diese Methode gefunden

http://vassarstats.net/rdiff.html

bin mir aber nicht sicher, ob dies zutrifft.

Pecorino
quelle
2
Werden Ihre beiden Korrelationen aus derselben Beobachtungsstichprobe berechnet?
Dimitriy V. Masterov
So etwas wie ein Konfidenzintervall für den Unterschied könnte funktionieren. Sie können die Simulation unter bestimmten Verteilungsannahmen oder unter asymptotischen normalen Näherungen verwenden. In großen Beispielen können Sie Bootstrapping verwenden.
Glen_b -State Monica
AFAIK leitet das CI aus den z-Scores ab und transformiert z in r für ein CI auf rs zurück. Selbst für ein Bootstrap-CI kann es angebracht sein, sie zuerst zu transformieren.
Jona

Antworten:

22

(Ich nehme an, Sie sprechen von Rs , die aus einer Probe stammen.)

Der Test auf dieser Website gilt in dem Sinne, dass er r wie jeden Parameter behandelt, dessen Wert zwischen zwei Populationen unterschiedlich sein kann. Wie unterscheidet sich r von anderen Messwerten wie dem Mittelwert, den Sie mit dem t- Test sehr sicher vergleichen können ? Nun, es ist insofern anders, als es zwischen -1,1 gebunden ist, es hat nicht die richtige Verteilung, also müssen Sie es vor der Inferenz nach Fisher transformieren (und danach nachträglich transformieren, wenn Sie zB ein CI erhalten möchten). Die aus dem Test resultierenden z-Werte haben die richtige Form, um Rückschlüsse zu ziehen. Das ist der Test, mit dem Sie verknüpfen.

Was Sie also verknüpfen, ist ein Verfahren, mit dem Sie ableiten können, was passieren könnte, wenn Sie das r für die gesamte Population (en) erhalten könnten, aus der Sie eine Stichprobe erstellen - wäre das r für eine Gruppe höher als für die andere oder wäre es sie sind genau gleich? Nennen wir diese spätere Hypothese H . Wenn der Test einen niedrigen p- Wert zurückgibt , bedeutet dies, dass Sie basierend auf Ihrer Stichprobe wenig Vertrauen in die Hypothese haben sollten, dass der wahre Wert für die Differenz zwischen den beiden Rs genau 0 wäre (da solche Daten selten auftreten würden, wenn der Unterschied in r war genau 0). Wenn nicht, haben Sie nicht die Daten, um diese Hypothese von genau gleichem Vertrauen mit Sicherheit abzulehnen0r , entweder weil es wahr ist und / oder weil Ihre Stichprobe nicht ausreicht. Beachten Sie, dass ich die gleiche Geschichte über den Unterschied in den Mitteln (unter Verwendung des t- Tests) oder eine andere Maßnahme hätte machen können.

Eine ganz andere Frage ist, ob der Unterschied zwischen den beiden sinnvoll wäre . Leider gibt es keine direkte Antwort darauf, und kein statistischer Test kann Ihnen die Antwort geben. Vielleicht ist der wahre Wert (der Bevölkerungswert, nicht der, den Sie beobachten) von r 0,5 in einer und 0,47 in der anderen Gruppe. In diesem Fall wäre die statistische Hypothese ihrer Äquivalenz (unser H ) falsch. Aber ist das ein bedeutender Unterschied? Es kommt darauf an - ist etwas in der Größenordnung von 3% mehr erklärter Varianz sinnvoll oder bedeutungslos? Cohen hat grobe Richtlinien für die Interpretation von r gegeben (und vermutlich Unterschiede zwischen r0's), aber nur unter dem Rat, dass dies nichts als ein Ausgangspunkt ist. Und Sie kennen nicht einmal den genauen Unterschied, selbst wenn Sie eine Schlussfolgerung ziehen, z. B. indem Sie den CI für die Unterschiede zwischen den beiden Korrelationen berechnen. Höchstwahrscheinlich sind eine Reihe möglicher Unterschiede mit Ihren Daten kompatibel.

Eine vergleichsweise sichere Wette wäre, die Konfidenzintervalle für Ihre Rs und möglicherweise die CI für deren Differenz zu berechnen und den Leser entscheiden zu lassen.

jona
quelle
4
Ich weiß nicht, ob Sie Lehrer sind, aber Sie sollten es sein. Dies ist selbst für jemanden mit Grundkenntnissen in Statistik dank Ihrer großartigen Erklärung leicht zu verstehen.
Luftangriff