Warum funktioniert meine Replikation von Silver & Dunlap 1987 nicht?

8

Ich versuche Silver & Dunlap (1987) zu replizieren . Ich vergleiche nur die Mittelungskorrelationen oder die Mittelung der z-Transformationskorrelationen und die Rücktransformation. Ich scheine die Asymmetrie in der Verzerrung, die sie finden, nicht zu replizieren (rücktransformierte zs sind für mich nicht näher am Bevölkerungswert als rs). Irgendwelche Gedanken? Ist es möglich, dass die Rechenleistung von 1987 den Raum einfach nicht genug erkundet hat?

# Fisher's r2z
fr2z <- atanh
# and back
fz2r <- tanh

# a function that generates a matrix of two correlated variables
rcor <- function(n, m1, m2, var1, var2, corr12){
    require(MASS)
    Sigma <- c(var1, sqrt(var1*var2)*corr12, sqrt(var1*var2)*corr12, var2)
    Sigma <- matrix(Sigma, 2, 2)
    return( mvrnorm(n, c(m1,m2), Sigma, empirical=FALSE) )
    }

Mit dieser Funktion ist es einfach, eine Reihe von Korrelationen zu betrachten (im Grunde genommen Silber und Dunlap 1987 replizieren) und den Unterschied zwischen der Mittelung von Korrelationen und der Mittelung von Z-Scores und der Rücktransformation zu erkennen. Hier ist nur einer.

r <- 0.9
Y <- replicate(20000, rcor(10, 0, 0, 1, 1, r))
rs <- apply(Y, 3, function(x) cor(x[,1], x[,2]))
mean(rs) - r
zs <- fr2z(rs)
fz2r( mean(zs) ) - r

Wenn man nur die Stichprobengröße von 10 und die Korrelationen von 0,1, 0,5 und 0,9 betrachtet, sind dies die Ergebnisse.

     rho  r bias   z bias
     0.1  -0.006   0.006
     0.5  -0.024   0.021
     0.9  -0.011   0.011

Und diese sind aus Tabelle 1 von Silver & Dunlap abgeleitet.

     rho  r bias   z bias
     0.1  -0.007   0.003
     0.5  -0.025   0.001
     0.9  -0.011  -0.007

Das sind ganz andere Ergebnisse. Aus meinem Test geht hervor, dass es nur um die Richtung der Voreingenommenheit geht, nicht um die Größe. Aber in der veröffentlichten Arbeit finden sie mit z viel weniger Größe. Ich konnte keine veröffentlichte Nichtreplikation finden.

John
quelle
Ich stecke bei deinen ersten beiden Zeilen fest. Sie scheinen keine korrekte R-Syntax zu haben. Sie scheinen auch anzunehmen, dass Atanh seine eigene Umkehrung ist, aber es ist nicht so: Tanh ist die Umkehrung von Atanh.
whuber
Sie sind nur Tippfehler in der Frage ... behoben.
John
1
Für mich sieht das r biasfür rho0,5 in der Silver & Dunlap-Tabelle nur für mich wie der Ausreißer aus. Ich kann sicherlich nicht für die Qualität des Journals bürgen, das ziemlich neu und an den Rändern etwas rau erscheint, aber ich habe dieses kürzlich erschienene Papier mit einer Google-Suche gefunden. Siehe insbesondere ihre Tabelle 3, die wiederum auf den ersten Blick Ihre Ergebnisse zu bestätigen scheint.
Kardinal
1
@ Whuber: Ganz richtig. Die UMVUE von im bivariaten Normalfall - wie Sie vielleicht sehr gut wissen - ist jedoch (ziemlich) alsHier ist die MLE. Manchmal erscheint dieser Schätzer unter der Notation . ρ
rΓ((n- -2)/.2)Γ(1/.2)Γ((n- -3)/.2)01u- -1/.2(1- -u)(n- -5)/.21- -u(1- -r2)du.
rG(r)
Kardinal
1
@whuber: Du bringst gute Punkte auf. Ich hatte auch keinen direkten Zugang zum S & D-Papier, daher wurden meine Bemerkungen auf Vermutungen reduziert. Wenn wir uns jemals persönlich treffen, tausche ich ein oder zwei Geschichten mit Ihnen bei einem Bier über die Frustrationen im Umgang mit denen aus, die darauf bestehen, Korrelationen zu mitteln. Ich stimme Ihren Kommentaren zu diesem Thema voll und ganz zu. Trotzdem kann es in einigen Einstellungen sinnvoll sein, mit denen ich im Allgemeinen weniger vertraut bin. :)
Kardinal

Antworten:

9

Für mich sieht der r biasEintrag für rho0,5 in der Silver & Dunlap-Tabelle am verdächtigsten anders aus. Aber das heißt, es ist nicht Ihr Schätzwert entsprechen ziemlich genau.

Leider habe ich derzeit keinen Zugriff auf das Silver & Dunlap-Papier, aber bei einer Google-Suche wurde ein kürzlich veröffentlichtes Papier gefunden, das eine ähnliche Studie wie die von Ihnen durchgeführte durchführt. Es ist

RL Gorsuch und CS Lehmann (2010), Korrelationskoeffizienten: Mittlere Verzerrung und Verzerrungen des Konfidenzintervalls , Journal of Methods and Measurement in the Social Sciences , vol. 1, nein. 2, 52–65.

Siehe insbesondere die Tabelle 3, die zumindest auf Augenhöhe Ihre Ergebnisse zu bestätigen scheint.

Ich kann mit Sicherheit nicht für die Qualität des Tagebuchs (oder des gesamten Papiers) bürgen, das meiner Einschätzung nach ziemlich neu und an den Rändern etwas rau aussieht. Vorbehalt Lektor.

Für eine eingehendere, theoretischere Behandlung der Inferenz zur Korrelation (einfach, partiell und mehrfach) hauptsächlich in einem multivariaten normalen Rahmen ist eine gute Referenz

FA Graybill, Theorie und Anwendung des linearen Modells , Duxbury Press, 1976, Kapitel 11 .

Es geht jedoch nicht viel um die Leistung kleiner Stichproben oder angewandte Aspekte.

Kardinal
quelle