Ich habe einen Forschungsstudenten mit einem bestimmten Problem beraten und wollte unbedingt die Meinung anderer auf dieser Website einholen.
Kontext:
Der Forscher hatte drei Arten von Prädiktorvariablen. Jeder Typ enthielt eine andere Anzahl von Prädiktorvariablen. Jeder Prädiktor war eine kontinuierliche Variable:
- Soziales: S1, S2, S3, S4 (dh vier Prädiktoren)
- Kognitiv: C1, C2 (dh zwei Prädiktoren)
- Verhalten: B1, B2, B3 (dh drei Prädiktoren)
Die Ergebnisvariable war ebenfalls kontinuierlich. Die Stichprobe umfasste rund 60 Teilnehmer.
Der Forscher wollte kommentieren, welche Arten von Prädiktoren für die Erklärung der Ergebnisvariablen wichtiger sind. Dies hing mit allgemeineren theoretischen Bedenken hinsichtlich der relativen Bedeutung dieser Arten von Prädiktoren zusammen.
Fragen
- Was ist ein guter Weg, um die relative Wichtigkeit eines Satzes von Prädiktoren im Vergleich zu einem anderen Satz zu bewerten?
- Was ist eine gute Strategie, um mit der Tatsache umzugehen, dass es in jeder Menge eine unterschiedliche Anzahl von Prädiktoren gibt?
- Welche Vorbehalte bei der Interpretation könnten Sie vorschlagen?
Verweise auf Beispiele oder Diskussionen über Techniken sind ebenfalls willkommen.
quelle
Vorschläge
Vorbehalte
quelle
Bedeutung
Als Erstes müssen Sie die "Wichtigkeit von Prädiktoren" operationalisieren. Ich gehe davon aus, dass dies so etwas wie "Empfindlichkeit des Mittelwerts gegenüber Änderungen der Prädiktorwerte" bedeutet. Da Ihre Prädiktoren gruppiert sind, ist die Empfindlichkeit des Mittelwerts für Gruppen von Prädiktoren interessanter als eine Variable für Variablenanalyse. Ich lasse offen, ob Sensibilität kausal verstanden wird. Diese Frage wird später aufgegriffen.
Drei Version von Bedeutung
Viele Abweichungen erklärt : Ich vermute, dass die erste Anlaufstelle für Psychologen wahrscheinlich eine Abweichungszerlegung ist, die ein Maß dafür liefert, wie viel Abweichung vom Ausgang durch die Varianz-Kovarianz-Struktur in jeder Gruppe von Prädiktoren erklärt wird. Da ich kein Experimentator bin, kann ich hier nicht viel vorschlagen, außer zu bemerken, dass das gesamte Konzept der "Varianzerklärung" für meinen Geschmack etwas unbegründet ist, auch ohne das Problem "Welche Summe welcher Quadrate". Andere können dem nicht zustimmen und es weiterentwickeln.
Große standardisierte Koeffizienten : SPSS bietet das (falsch benannte) Beta, um die Auswirkung auf eine Art und Weise zu messen, die variablenübergreifend vergleichbar ist. Es gibt mehrere Gründe, dies nicht zu verwenden, wie in Fox 'Regressionslehrbuch hier und anderswo erörtert . Hier bewerben sich alle. Es ignoriert auch die Gruppenstruktur.
Auf der anderen Seite, ich kann mir vorstellen , dass man könnte Prädiktoren in Gruppen und die Verwendung Kovarianzinformation standardisieren die Wirkung einer eine Standardabweichung Bewegung in allen von ihnen zu richten. Persönlich dämpft das Motto: "Wenn sich etwas nicht lohnt, lohnt es sich nicht gut zu machen" mein Interesse daran.
Große Randeffekte : Der andere Ansatz besteht darin, im Maßstab der Messungen zu bleiben und Randeffekte zwischen sorgfältig ausgewählten Stichprobenpunkten zu berechnen. Da Sie an Gruppen interessiert sind, ist es hilfreich, Punkte auszuwählen, um Gruppen von Variablen zu variieren, anstatt einzelne, z. B. um beide kognitiven Variablen gleichzeitig zu manipulieren. (Viel Gelegenheit für coole Grundstücke hier). Grundlegendes Papier hier . Das
effects
Paket in R wird dies gut tun.Hier gibt es zwei Einschränkungen:
Wenn Sie dies tun, sollten Sie darauf achten, dass Sie nicht zwei kognitive Variablen auswählen, die zwar einzeln plausibel sind, z.
Einige Variablen sind theoretisch nicht einmal manipulierbar, daher ist die Interpretation von Randeffekten als kausal heikler, obwohl immer noch nützlich.
Unterschiedliche Anzahl von Prädiktoren
Probleme ergeben sich aus der Kovarianzstruktur der gruppierten Variablen, über die wir uns normalerweise keine Gedanken machen, die wir aber für diese Aufgabe haben sollten.
Insbesondere bei der Berechnung von Randeffekten (oder für diesen Fall standardisierten Koeffizienten) auf Gruppen und nicht auf einzelne Variablen erleichtert der Fluch der Dimensionalität bei größeren Gruppen den Vergleich in Regionen, in denen es keine Fälle gibt. Mehr Prädiktoren in einer Gruppe führen zu einem dünn besiedelten Raum, sodass jede wichtige Messung mehr von Modellannahmen und weniger von Beobachtungen abhängt (aber Ihnen nicht sagt, dass ...). Dies sind jedoch dieselben Probleme wie in der Modellanpassungsphase Ja wirklich. Mit Sicherheit die gleichen wie bei einer modellbasierten Kausalverträglichkeitsprüfung.
quelle
Eine Methode besteht darin, die Variablensätze zu Garbenvariablen zu kombinieren. Diese Methode wurde ausgiebig in der Soziologie und verwandten Bereichen eingesetzt.
Refs:
Whitt, Hugh P. 1986. "The Sheaf Coefficient: Ein vereinfachter und erweiterter Ansatz." Social Science Research 15: 174-189.
quelle