Haftungsausschluss: Wenn Sie feststellen, dass diese Frage einer anderen zu ähnlich ist, freue ich mich, dass sie zusammengeführt wird. Ich habe jedoch nirgendwo anders eine zufriedenstellende Antwort gefunden (und habe noch nicht den "Ruf", Kommentare abzugeben oder zu stimmen), daher dachte ich, es wäre am besten, selbst eine neue Frage zu stellen.
Meine Frage ist dies. Für jedes der 12 menschlichen Probanden habe ich einen Korrelationskoeffizienten (Spearman-Rho) zwischen 6 Ebenen einer unabhängigen Variablen X und entsprechenden Beobachtungen einer abhängigen Variablen Y berechnet. (Hinweis: Die Ebenen von X sind nicht für alle Probanden gleich.) My Die Nullhypothese lautet, dass diese Korrelation in der Allgemeinbevölkerung gleich Null ist. Ich habe diese Hypothese auf zwei Arten getestet:
Verwendung eines t-Tests mit einer Stichprobe zu den Korrelationskoeffizienten meiner 12 Probanden.
Indem ich meine X-Ebenen und Beobachtungen von Y so zentriere, dass für jeden Teilnehmer Mittelwert (X) = 0 und Mittelwert (Y) = 0 ist, und dann eine Korrelation über die aggregierten Daten berechnet (72 Ebenen von X und 72 Beobachtungen von Y) .
Nachdem ich über das Arbeiten mit Korrelationskoeffizienten (hier und anderswo) gelesen habe, habe ich angefangen zu bezweifeln, ob der erste Ansatz gültig ist. Insbesondere habe ich die folgende Gleichung an mehreren Stellen gesehen, die (anscheinend) als t-Test für durchschnittliche Korelationskoeffizienten dargestellt wurden:
Dabei wäre der durchschnittliche Korrelationskoeffizient (und nehmen wir an, wir haben diesen zuerst mit der Fisher-Transformation für die Pro-Subjekt-Koeffizienten erhalten) und die Anzahl der Beobachtungen. Intuitiv erscheint mir dies falsch, da es kein Maß für die Variabilität zwischen Subjekten enthält. Mit anderen Worten, wenn ich 3 Korrelationskoeffizienten hätte, würde ich die gleiche t-Statistik erhalten, unabhängig davon, ob sie [0,1, 0,5, 0,9] oder [0,45, 0,5, 0,55] oder ein beliebiger Wertebereich mit demselben Mittelwert (und ) sind.n n = 3
Ich vermute daher, dass die obige Gleichung tatsächlich nicht gilt, wenn die Signifikanz eines Durchschnitts von Korrelationskoeffizienten getestet wird, sondern wenn die Signifikanz eines einzelnen Korrelationskoeffizienten basierend auf Beobachtungen von 2 Variablen getestet wird.
Könnte hier jemand bitte diese Intuition bestätigen oder erklären, warum es falsch ist? Wenn diese Formel nicht für meinen Fall gilt, kennt jemand einen / den richtigen Ansatz? Oder ist mein eigener Test Nummer 2 schon gültig? Jede Hilfe wird sehr geschätzt (einschließlich Hinweisen auf frühere Antworten, die ich möglicherweise übersehen oder falsch interpretiert habe).
quelle
Antworten:
Ein besserer Ansatz zur Analyse dieser Daten besteht darin, ein gemischtes Modell (auch bekannt als Mischeffektmodell, hierarchisches Modell)
subject
als Zufallseffekt (zufälliger Schnittpunkt oder zufälliger Schnittpunkt + Steigung) zu verwenden. Um eine andere Antwort von mir zusammenzufassen:Dies ist im Wesentlichen eine Regression, die eine einzelne Gesamtbeziehung modelliert und gleichzeitig zulässt, dass sich diese Beziehung zwischen Gruppen (den menschlichen Subjekten) unterscheidet. Dieser Ansatz profitiert vom teilweisen Pooling und nutzt Ihre Daten effizienter.
quelle
Ich gehe davon aus, dass die Variablen ( und ) für alle Personen gleich sind (eigentlich bin ich mir nicht sicher, was Sie damit meinen, dass die Ebenen nicht fachübergreifend gleich sind: Ich hoffe, Sie sind es unter Bezugnahme auf die Unabhängigkeit zwischen den Bereichen der Variablen, nicht darauf, welche Variablen für jedes Individuum gemessen werden). Ja, die von Ihnen gezeigte Formel gilt für den Korrelationskoeffizienten zwischen zwei Variablen.12 6 X 6 Y
In Punkt 2 sprechen Sie über Normalisierung: Ich denke, dies wäre sinnvoll, wenn Sie dies für jede der Variablen separat tun würden . Das Problem bei diesem Ansatz ist jedoch, dass die Abhängigkeit innerhalb des Einzelnen nicht kontrolliert wird.6∗2
Ich glaube, Ihr Ansatz 1 ist auch nicht gültig, da es sich um einen Test unter Variablen mit einer Verteilung mit nur Freiheitsgraden handelt. Daher glaube ich nicht, dass Sie in diesem Fall den zentralen Grenzwertsatz anwenden können.6 t 10
Bei größeren Zahlen könnten Sie möglicherweise einen Zufallseffektansatz verwenden, der eine zufällige Steigung ermöglicht und gleichzeitig sowohl einen durchschnittlichen (von auf ) als auch das Nichtvorhandensein eines zufälligen Koeffizienten . Ich glaube jedoch, dass 6 Variablen und 12 Beobachtungen nicht ausreichen, um dies zu tun.Xi Yi
Ich schlage vor, Sie sehen es als Test für 6 Werte (12, wenn Sie auch Werte unterhalb der Diagonale berücksichtigen) der Korrelationsmatrix zwischen den Variablen (sowohl als auch ), dh diejenigen auf der Diagonale der 2. (und äquivalent zum 3.) Quadranten. Daher würde ich einen Likelihood-Ratio-Test zwischen dem eingeschränkten und dem uneingeschränkten Modell durchführen.12 X Y
@Alexis Mein Verständnis ist, dass , , indem sie durch Sinn machen würde (ich glaube es auch Sinn machen würde , sie durch ihr teilen ‚s). Auf diese Weise hätten alle Variablen und (erstellt unter Berücksichtigung von als ob sie Vorkommen einer eindeutigen Variablen wären , und dasselbe für ) ein Mittelwert. Im Gegenteil, wenn wir zuerst zwei Variablen erstellen (erstellt unter Berücksichtigung vonX1,…,X6 Y1,…,Y6 X∗1=X1−X1¯,…,X∗6=X6−X6¯,Y∗1=Y1−Y1¯,…,Y∗6=Y6−Y6¯ SE X∗ Y∗ X∗i,1≤i≤6 Y∗i 0 X,Y Xi,1≤i≤6 Als ob sie Vorkommen einer eindeutigen Variablen und dasselbe für ), würde das Subtrahieren des Mittelwerts (und auch das Teilen durch die SE von und ) natürlich nichts ändern.Yi X Y
EDIT 01/01/18
Sei die Variable und ( ) das Individuum. Nehmen wir an, wir haben:i j 1≤j≤12
Die Korrelation sollte in diesem Fall .0.5428
Wenn wir jede Variable haben wir für sowohl als auch keine Variation, wir haben: . Für wir die Werte (dh für die : und genau das Gegenteil für die ). Da und , erhalten wir: , was eine Korrelation von impliziert .1≤i≤5 Xi Yi X∗ij=Y∗ij=0 i=6 X∗6j=j−6.5,Y∗j6=(13−j)−6.5=6.5−j X −5.5,−4.5,−3.5,−2.5,−1.5,−0.5,0.5,1.5,2.5,3.5,4.5,5.5 Y 0=−0 j−6.5=−(6.5−j) X∗ij=−Y∗ij∀i,j→X∗=−Y∗ −1
quelle