Signifikanztests von drei oder mehr Korrelationen unter Verwendung der Fisher-Transformation

9

Nach meinen früheren Beiträgen muss ich, soweit ich verstehen kann, drei Korrelationskoeffizienten paarweise testen, um festzustellen, ob zwischen ihnen ein signifikanter Unterschied besteht.

Dies bedeutet, dass ich die Fishers-Transformation verwenden müsste, um den z-Wert von r und dann den p-Wert von z (was die empfohlenen Taschenrechner in den früheren Beiträgen zum Glück tun) zu berechnen und dann festzustellen, ob der p-Wert höher oder niedriger als ist mein Alpha-Wert (0,05) für jedes Paar.

dh wenn 21 bis 30 Jahre Altersgruppe 1, 31 bis 40 Jahre Altersgruppe 2 und 41 bis 50 Jahre Altersgruppe 2 sind, wäre mein Vergleich der Korrelationen zwischen ihren Einkaufsgewohnheiten und Gewichtsverlust:

  • Gruppe 1 gegen Gruppe 2
  • Gruppe 1 gegen Gruppe 3
  • Gruppe 2 gegen Gruppe 3

Gibt es eine Möglichkeit, alle drei Berechnungen in einem einzigen Schritt durchzuführen, anstatt drei separate Berechnungen durchzuführen?

Adhesh Josh
quelle
1
Könnten Sie bitte etwas detaillierter sein? Wie in - was ist Ihre Antwort, Ihre erklärenden Variablen und welche Korrelationen interessieren Sie? Möglicherweise verwenden Sie nicht die Fisher-Transformation zum Testen der Korrelation. Ein einfacher T-Test kann ausreichend sein.
Suncoolsu
@suncoolsu Ich teste die Korrelation zwischen Einkaufsgewohnheiten und Gewichtszunahme für diese drei Gruppen. Meine Ergebnisse sind wie folgt: Gruppe 1: r = 0,8978, n = 105; Gruppe 2: r = 0,5678, n = 95; und Gruppe 3: r = 0,7865, n = 120.
Adhesh Josh
Ich denke, Ihre Daten bestehen die IOTT. Das ist der interokulare Traumatest - er trifft Sie zwischen den Augen. Wenn sich die Korrelationen von .9, .6 und .8 nicht voneinander unterscheiden, was ist das? Aber wenn Sie wirklich interessiert sind
Peter Flom - Reinstate Monica

Antworten:

4

Ihre Frage ist ein perfektes Beispiel für Regressionsmodelle mit quantitativen und qualitativen Prädiktoren. Insbesondere sind die drei Altersgruppen - - sind die qualitativen Variablen und die quantitativen Variablen sindEinkaufsgewohnheitenundGewichtsverlust(ich vermute dies, weil Sie Korrelationen berechnen).1,2,&3

Ich muss betonen, dass dies eine viel bessere Methode zur Modellierung ist als die Berechnung separater gruppenweiser Korrelationen, da Sie mehr Daten modellieren müssen, sodass Ihre Fehlerschätzungen (p-Werte usw.) zuverlässiger sind. Ein technischerer Grund sind die daraus resultierenden höheren Freiheitsgrade in der t-Test-Statistik zum Testen der Signifikanz der Regressionskoeffizienten.

Nach der Regel, dass qualitative Prädiktoren von c - 1 Indikatorvariablen verarbeitet werden können, werden hier nur zwei Indikatorvariablen X 1 , X 2 benötigt, die wie folgt definiert sind:cc- -1X.1,X.2

X 2 = 1,  wenn die Person zur Gruppe 2 gehört ; 0  sonst .

X.1=1 wenn die Person zur Gruppe 1 gehört;;0 Andernfalls.
X.2=1 wenn die Person zur Gruppe 2 gehört;;0 Andernfalls.

Dies impliziert, dass Gruppe durch X 1 = 0 , X 2 = 0 dargestellt wird ; vertreten Ihre Antwort - Einkaufen Gewohnheit als Y und der quantitativen erklärende Variable Gewichtsverlust als W . Sie sind jetzt fit dieses lineare Modell3X.1=0,X.2=0Y.W.

Die offensichtliche Frage ist, ob es wichtig ist, ob wir W und Y ändern(weil ich zufällig Einkaufsgewohnheiten als Antwortvariable ausgewählt habe). Die Antwort lautet: Ja - die Schätzungen der Regressionskoeffizienten ändern sich, der Test auf "Assoziation" zwischen konditionierten Gruppen (hier t-Test, aber er ist der gleiche wie der Test auf Korrelation für eine einzelne Prädiktorvariable) nicht Veränderung. Insbesondere

E.[Y.]]=β0+β1X.1+β2X.2+β3W..
W.Y.

E [ Y ] = ( β 0 + β 2 ) + β 3 W  - für die zweite Gruppe , E [ Y ] = ( β 0 + β 1) ) + β 3 W  - für die erste Gruppe . Dies entspricht 3 separaten Linien, abhängig von den Gruppen, wenn Sie Y zeichnen

E.[Y.]]=β0+β3W. - für die dritte Gruppe,
E.[Y.]]=(β0+β2)+β3W. - Für die zweite Gruppe,
E.[Y.]]=(β0+β1)+β3W. - Für die erste Gruppe,
Y.vs . Dies ist eine gute Möglichkeit, um zu visualisieren, worauf Sie testen. Dies ist im Grunde genommen eine Form der EDA- und Modellprüfung, aber Sie müssen zwischen gruppierten Beobachtungen richtig unterscheiden. Drei parallele Linien zeigen keine Interaktion zwischen den drei Gruppen und W an , und viele Interaktionen implizieren, dass sich diese Linien überschneiden.W.W.

Wie machen die Tests, die Sie fragen. Grundsätzlich müssen Sie einige Kontraste testen, sobald Sie das Modell angepasst haben und die Schätzungen haben. Speziell für Ihre Vergleiche:

Gruppe 2 gegen Gruppe 3: β2+β0- -β0=0,
Gruppe 1 gegen Gruppe 3: β1+β0- -β0=0,
Gruppe 2 gegen Gruppe 1: β2+β0- -(β0+β1)=0.
Suncoolsu
quelle
Das Testen der Äquivalenz von Steigungen unterscheidet sich vom Testen der Äquivalenz von Korrelationen. Siehe zum Beispiel: jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang
Ich stimme zu, aber für eine einzelne Prädiktorvariable sollten sie aufgrund dieser Beziehung identisch seint=ρn- -21- -ρ2tn- -2
In Ihrem Dokument geht es auch um den Vergleich verschiedener Populationen, was bei einzelnen Prädiktoren nicht der Fall ist.
Suncoolsu
H.0::β1=β2=β3H.0::ρ1=ρ2=ρ3β
Ja, Sie haben Recht (wie ich bereits sagte), aber meine Antwort geht davon aus, dass das OP daran interessiert war, die Beziehung zwischen Gewichtsverlust und Einkaufsgewohnheiten anhand von Gruppen zu bestimmen (nicht unbedingt Korrelation). Ich glaube, ich habe mich geirrt, weil das OP die andere Antwort akzeptiert hat. Trotzdem dient diese Antwort als nützliche Alternative (hoffe ich).
Suncoolsu
1

Ein paarweises Testen in dieser Situation ist (noch) nicht durch die Datenbeschreibung gerechtfertigt. Sie sollten Regressionsmethoden mit mehreren Variablen verwenden. Ein R-Anruf könnte sein:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

Das Konstruieren von 3 Kategorien ist nicht die beste Methode, um das Alter zu kontrollieren (oder seinen Beitrag zu analysieren, wenn dies die Hauptfrage ist), da die Kategorisierung kontinuierliche Beziehungen verzerren kann und Spline-Begriffe die Notwendigkeit beseitigen, willkürliche Teilungspunkte auszuwählen. Sobald nach einer ordnungsgemäßen Analyse ausreichende Hinweise auf eine Assoziation von Gewichtsänderungen vorliegen, können Ad-hoc-Testoptionen bereitgestellt werden.

(Ich stimmte den meisten Aussagen von @whuber in einem Kommentar zu, und ich finde seinen Kommentar im Allgemeinen maßgeblich, verstehe aber seine Haltung zu Regressionsansätzen nicht.)

DWin
quelle