Korrelationskoeffizienten vergleichen

11

Ich habe zwei Datensätze, bei denen ich ~ 250.000 Werte für 78 und 35 Proben habe. Einige der Stichproben gehören zu einer Familie, was sich auf die Daten auswirken kann. Ich habe die paarweise Korrelation berechnet und sie variiert zwischen 0,7 und 0,95, aber ich möchte wissen, ob es einen signifikanten Unterschied zwischen den Korrelationskoeffizienten innerhalb und zwischen den Familien gibt. Was ist der beste Weg, dies zu tun? Vielen Dank

biomed
quelle

Antworten:

6

Ein allgemeiner Weg, um zwei Korrelationskoeffizienten ist die Verwendung der Fisher-Z-Transformationsmethode, die besagt, dass ist ungefähr normal mit dem Mittelwert und der Standardabweichung . Wenn die Stichproben unabhängig sind, transformieren Sie jeden Korrelationskoeffizienten und die Differenz zwischen den beiden transformierten Korrelationen ist normal mit dem Mittelwert und Standardabweichung . Daraus können Sie eine Form -statistic und Sie testen , wie Sie es in einem gewöhnlichen Zwei Probe -Test.ρ^1,ρ^2arctanh(ρ^)arctanh(ρ)1/n3arctanh(ρ1)arctanh(ρ2)1/(n13)+1/(n23)zz

Makro
quelle
2

Die Antwort von @ Macro ist zwar nett, erfordert jedoch eine Annahme über die (In-) Abhängigkeit der Statistiken. Ein anderer Ansatz wäre die Verwendung von Bootstrapping. Die Idee wäre, eine Variable fest zu halten und die andere Variable zu mischen, die Korrelation für jede Ihrer Stichproben zu berechnen und deren Differenz zu ermitteln. Wiederholen Sie diesen Vorgang viele Male, um eine Verteilung zu erhalten, und verwenden Sie diese Verteilung, um die Hypothese zu testen, dass die Korrelationen gleich sind. Die Struktur Ihres Datensatzes ist mir nicht so klar, daher ist es schwierig, weitere Details bereitzustellen.

Charlie
quelle