Erwarteter Wert und Varianz der Stichprobenkorrelation

7

Ich habe nach einem Ausdruck für den erwarteten Wert und die Varianz des Stichproben-Korrelationskoeffizienten gesucht. Die meisten Quellen, die ich gefunden habe, führen als Varianz des Stichproben-Korrelationskoeffizienten auf, dies setzt jedoch voraus und folgen einer bivariaten Normalverteilung.

Var(Cor(X,Y))1ρ2n2,
XY

Es scheint auch verschiedene Ansätze zur Reihenerweiterung der Funktion zu geben, um die Momente der Korrelationsfunktion zu approximieren. Mir war jedoch nicht klar, welche Annahmen es gibt (z. B. Normalität) oder welcher der aktuellste Ausdruck ist.

Kennt jemand einen Ausdruck (ungefähr oder nicht) für den erwarteten Wert und die Varianz des Korrelationskoeffizienten (Pearsons), der keine bestimmte Verteilung auf die Zufallsvariablen annimmt?

Aktualisieren:

Einige meiner Quellen:

Nimmt eine bivariate Normalverteilung an:

Veröffentlichte Werke:

Hotelling (1953): Neues Licht auf den Korrelationskoeffizienten und seine Transformationen. ( http://www.jstor.org/stable/2983768 )

Fisher (1921): ( https://digital.library.adelaide.edu.au/dspace/bitstream/2440/15169/1/14.pdf )

Webquellen:

Gerstman ( http://www.sjsu.edu/faculty/gerstman/StatPrimer/correlation.pdf )

Stapelaustausch ( Standardfehler aus Korrelationskoeffizient )

Wikipedia ( https://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient#Inference )

Holland ( http://strata.uga.edu/6370/lecturenotes/correlation.html )

Gibt nicht die Annahme einer bivariaten Normalität an, sollte aber angenommen werden:

Stapelüberlauf ( /programming/16097453/how-to-compute-p-value-and-standard-error-from-correlation-analysis-of-rs-cor )

Ich verstehe das leider nicht, aber es scheint ein fruchtbarer Ansatz zu sein:

Hawkings (1989) - Ableiten der asymptotischen Verteilung der Z-Statistik von Fischer mithilfe der U-Statistik ( http://www.jstor.org/stable/2685369 )

Tommy L.
quelle
1
"Die meisten Quellen" Können Sie sie auflisten? Diese Ergebnisse interessieren mich auch, selbst wenn ich von einer bivariaten Normalverteilung ausgehe. Danke.
Mikrofon
1
Ich habe meine Frage mit einer Liste einiger der gefundenen Quellen aktualisiert. Ich wäre sehr dankbar, wenn Sie eine Antwort hinzufügen würden, wenn / wenn Sie einer Antwort näher kommen ;-)
Tommy L
3
Die große Stichprobenvarianz eines Korrelationskoeffizienten ist (oder nur im Nenner). Ihnen fehlt dort ein Quadrat. Was in den Nenner zu setzen ist, ist umstritten, aber da dies sowieso eine Annäherung an eine große Stichprobe ist, ist es irgendwie irrelevant. (1ρ2)2n1n
Wolfgang
1
@ Wolfgang: Aber dieser Ausdruck setzt voraus, dass die Variablen bivariat normal sind, nicht wahr?
Tommy L
2
@ Wolfgang: Hast du eine Referenz dafür? Alles, was ich finde, ist, dass , was im Quadrat die Varianz ergibt, wie ich sie in meiner Frage geschrieben habe. SE=1ρ2n2
Tommy L

Antworten:

5

Ich kann Ihnen keinen einzigen Ausdruck geben, aber hier sind einige Artikel, die einige nicht normale Fälle behandeln:

Browne, MW & Shapiro, A. (1986). Die asymptotische Kovarianzmatrix der Probenkorrelationskoeffizienten unter allgemeinen Bedingungen. Lineare Algebra und ihre Anwendungen, 82, 169-176.

Gayen, AK (1951). Die Häufigkeitsverteilung des Produkt-Moment-Korrelationskoeffizienten in Zufallsstichproben beliebiger Größe aus nicht normalen Universen. Biometrika, 38, 219 & ndash; 247.

Kowalski, C. (1972). Zu den Auswirkungen der Nichtnormalität auf die Verteilung des Produkt-Moment-Korrelationskoeffizienten der Probe. Angewandte Statistik, 21, 1-12.

Subrahmaniam, K. & Gajjar, AV (1980). Robustheit gegenüber Nichtnormalität einiger Transformationen des Probenkorrelationskoeffizienten. Journal of Multivariate Analysis, 10, 60-77.

Yuan, K.-H. & Bentler, PM (2000). Rückschlüsse auf Korrelationskoeffizienten in einigen Klassen nicht normaler Verteilungen. Journal of Multivariate Analysis, 72, 230 & ndash; 248.

Wolfgang
quelle
Vielen Dank! Ich werde diese studieren. Es scheint, ich muss lernen, Edgeworth-Serie zu verwenden .. ;-)
Tommy L