Nach meinen früheren Beiträgen muss ich, soweit ich verstehen kann, drei Korrelationskoeffizienten paarweise testen, um festzustellen, ob zwischen ihnen ein signifikanter Unterschied besteht.
Dies bedeutet, dass ich die Fishers-Transformation verwenden müsste, um den z-Wert von r und dann den p-Wert von z (was die empfohlenen Taschenrechner in den früheren Beiträgen zum Glück tun) zu berechnen und dann festzustellen, ob der p-Wert höher oder niedriger als ist mein Alpha-Wert (0,05) für jedes Paar.
dh wenn 21 bis 30 Jahre Altersgruppe 1, 31 bis 40 Jahre Altersgruppe 2 und 41 bis 50 Jahre Altersgruppe 2 sind, wäre mein Vergleich der Korrelationen zwischen ihren Einkaufsgewohnheiten und Gewichtsverlust:
- Gruppe 1 gegen Gruppe 2
- Gruppe 1 gegen Gruppe 3
- Gruppe 2 gegen Gruppe 3
Gibt es eine Möglichkeit, alle drei Berechnungen in einem einzigen Schritt durchzuführen, anstatt drei separate Berechnungen durchzuführen?
quelle
Antworten:
Ihre Frage ist ein perfektes Beispiel für Regressionsmodelle mit quantitativen und qualitativen Prädiktoren. Insbesondere sind die drei Altersgruppen - - sind die qualitativen Variablen und die quantitativen Variablen sindEinkaufsgewohnheitenundGewichtsverlust(ich vermute dies, weil Sie Korrelationen berechnen).1 , 2 , &3
Ich muss betonen, dass dies eine viel bessere Methode zur Modellierung ist als die Berechnung separater gruppenweiser Korrelationen, da Sie mehr Daten modellieren müssen, sodass Ihre Fehlerschätzungen (p-Werte usw.) zuverlässiger sind. Ein technischerer Grund sind die daraus resultierenden höheren Freiheitsgrade in der t-Test-Statistik zum Testen der Signifikanz der Regressionskoeffizienten.
Nach der Regel, dass qualitative Prädiktoren von c - 1 Indikatorvariablen verarbeitet werden können, werden hier nur zwei Indikatorvariablen X 1 , X 2 benötigt, die wie folgt definiert sind:c c - 1 X.1, X.2
X 2 = 1, wenn die Person zur Gruppe 2 gehört ; 0 sonst .
Dies impliziert, dass Gruppe durch X 1 = 0 , X 2 = 0 dargestellt wird ; vertreten Ihre Antwort - Einkaufen Gewohnheit als Y und der quantitativen erklärende Variable Gewichtsverlust als W . Sie sind jetzt fit dieses lineare Modell3 X.1= 0 , X.2= 0 Y. W.
Die offensichtliche Frage ist, ob es wichtig ist, ob wir W und Y ändern(weil ich zufällig Einkaufsgewohnheiten als Antwortvariable ausgewählt habe). Die Antwort lautet: Ja - die Schätzungen der Regressionskoeffizienten ändern sich, der Test auf "Assoziation" zwischen konditionierten Gruppen (hier t-Test, aber er ist der gleiche wie der Test auf Korrelation für eine einzelne Prädiktorvariable) nicht Veränderung. Insbesondere
E [ Y ] = ( β 0 + β 2 ) + β 3 W - für die zweite Gruppe , E [ Y ] = ( β 0 + β 1) ) + β 3 W - für die erste Gruppe . Dies entspricht 3 separaten Linien, abhängig von den Gruppen, wenn Sie Y zeichnen
Wie machen die Tests, die Sie fragen. Grundsätzlich müssen Sie einige Kontraste testen, sobald Sie das Modell angepasst haben und die Schätzungen haben. Speziell für Ihre Vergleiche:
quelle
Ein paarweises Testen in dieser Situation ist (noch) nicht durch die Datenbeschreibung gerechtfertigt. Sie sollten Regressionsmethoden mit mehreren Variablen verwenden. Ein R-Anruf könnte sein:
Das Konstruieren von 3 Kategorien ist nicht die beste Methode, um das Alter zu kontrollieren (oder seinen Beitrag zu analysieren, wenn dies die Hauptfrage ist), da die Kategorisierung kontinuierliche Beziehungen verzerren kann und Spline-Begriffe die Notwendigkeit beseitigen, willkürliche Teilungspunkte auszuwählen. Sobald nach einer ordnungsgemäßen Analyse ausreichende Hinweise auf eine Assoziation von Gewichtsänderungen vorliegen, können Ad-hoc-Testoptionen bereitgestellt werden.
(Ich stimmte den meisten Aussagen von @whuber in einem Kommentar zu, und ich finde seinen Kommentar im Allgemeinen maßgeblich, verstehe aber seine Haltung zu Regressionsansätzen nicht.)
quelle