Ist die Stichprobenkorrelation immer positiv mit der Stichprobenvarianz korreliert?

7

Die Stichprobenkorrelation und die Stichprobenstandardabweichung von (nenne es ) scheinen positiv korreliert zu sein, wenn ich bivariates normales , mit einer positiven wahren Korrelation simuliere (und scheinen negativ korreliert zu sein, wenn die wahre Korrelation zwischen und ist Negativ). Ich fand das etwas eingängig. Sehr heuristisch denke ich, dass dies die Tatsache widerspiegelt, dass die erwartete Zunahme von Y (in Einheiten von SD (Y)) für eine Zunahme von X um eine SD darstellt, und wenn wir ein größeres , dann spiegelt die Änderung von Y wider verbunden mit einer größeren Änderung in X.rXsXXYXYrsXr

Ich würde jedoch gerne wissen, ob für im Allgemeinen gilt (zumindest für den Fall, dass X und Y bivariat normal und mit großem n sind). Wenn wir eine echte SD bezeichnen lassen, haben wir:Cov(r,sx)>0r>0σ

Cov(r,sX)=E[rsX]ρσx

E[Cov^(X,Y)sY]Cov(X,Y)σY

Ich habe versucht, im ersten Term eine Taylor-Erweiterung zu verwenden, aber das hängt von ist also eine Sackgasse. Irgendwelche Ideen?Cov(Cov^(X,Y),sY)

BEARBEITEN

Vielleicht wäre eine bessere Richtung zu versuchen zu zeigen, dass , wobei der OLS-Koeffizient von Y auf X ist. Dann könnten wir das argumentieren, da , dies impliziert das gewünschte Ergebnis. Da fast wie ein Unterschied der Stichprobenmittelwerte ist, könnten wir vielleicht das erstere Ergebnis erhalten, indem wir so etwas wie die bekannte Unabhängigkeit des Stichprobenmittelwerts und der Varianz für ein normales Wohnmobil verwenden?Cov(β^,sX)=0β^β^=rsYsXβ^

halber Durchgang
quelle
Es wäre unverändert. Hmm. Ich fürchte, ich sehe die Relevanz noch nicht.
Halb passieren
Ich sollte wohl auch beachten , dass , während ich wünschte , das eine Hausaufgaben Frage waren, ist es nicht ... :)
Halb passieren
1
Ah, ich habe die Frage nicht sorgfältig genug gelesen. Entschuldigen Sie.
Jbowman
Die erste Gleichheit in Ihrer Berechnung ist nicht korrekt. ist konsistent für die Standardabweichung, aber nicht unvoreingenommen: en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviationsx=sx2
Andrew M
Für großes n ist es jedoch nahezu unvoreingenommen - der Faustregelkorrekturfaktor für ein normales Wohnmobil ist (n - 1,5) vs. (n - 1).
Halb passieren

Antworten:

4

TL; dr

Die nicht diagonalen Einträge der Stichproben-Kovarianz werden im Allgemeinen mit den diagonalen Einträgen korreliert, da nur dann gilt, wenn spezielle Bedingungen für die gemischten Momente 4. Ordnung gelten. Wenn bivariate Gaußsche Werte sind, gelten diese Bedingungen nur, wenn von unabhängig ist .E(XY3)E(XY)E(Y2)=0(X,Y)XY

Einzelheiten

Es gibt ein asymptotisches Ergebnis, das hier gezeigt werden kann, indem die Grenzverteilung von mal der Probenkovarianz untersucht wird (nach der CLT wird es multivariate Normalen sein) und dann die Delta-Methode angewendet wird. Dies bedeutet leider, dass wir einen Umweg über eine Ableitung der Verteilung der Stichproben-Kovarianz machen müssen da ich online keine guten Referenzen dazu finden kann. Wenn Sie bereit sind, Normalität anzunehmen, können Sie mit Kenntnis der Kovarianz der Wishart-Verteilung direkt zu Abschnitt 2 springen.n1

1 Die asymptotische Verteilung der Probenkovarianz

Sei eine iid-Stichprobe aus einer bivariaten Verteilung mit endlichen vierten Momenten und sei Ohne Verlust der Allgemeinheit und um lästige zusätzliche Buchhaltung zu vermeiden, nehmen wir . V1,,VnVi=(XiYi)

Cov(Vi)=(σ2ρστρσττ2)=Σ.
E(Vi)=0

Dann ist durch die Linearität der Erwartung und das schwache Gesetz großer Zahlen die Stichproben-Kovarianz ist unvoreingenommen und konsistent für und tatsächlich

Sn=1n1i=1n(ViV¯n)(ViV¯n)T=1n1i=1ViViTnn1V¯nV¯nT
Σ
n(SnΣ)dN(0,Λ).

Die Übung geht somit zur Bestimmung von . Für eine symmetrische Matrix , lassen sein , die "Vektorisierung" seines oberen Dreiecks. Betrachten Sie nun ein einzelnes Element des Durchschnitts, das in den führenden Term (die Streumatrix) von : Durch die Null-Mittelwert-Annahme, dass bereits und durch Berücksichtigung der Potenzen von und , die in , können wir einfach schreiben ΛA=(abbc)A~=(a,b,c)TSn

Z~i=ViViT~=(Xi2XiYiYi2).
E(Zi)=Σ~XYZ~iZ~iT
Cov(Z~i)=E(Z~iZ~iT)E(Z~i)E(Z~i)T=(κ40σ4κ31σ2τκ22σ2τ2κ31σ2τκ22σ2τ2κ13στ3κ22σ2τ2κ13στ3κ04τ4)Σ~Σ~T.

Hier gibt das an gemischtes standardisiertes Moment (ungefähr der Mittelwert, aber wir haben zu Beginn den Mittelwert Null angenommen).

κij=E[(Xiσ)i(Yiτ)j]
ij

Alternativ haben wir die Faktorisierung wobei , und

Cov(Z~i)=D(σ,τ)[KR(ρ)R(ρ)T]D(σ,τ),(1)
D(σ,τ)=diag(σ2,στ,τ2)R(ρ)=(1,ρ,1)T
K=(κ04κ31κ22κ31κ22κ13κ22κ13κ04).

Wir haben also, dass und , die die Stichprobenvarianz von und die Kovarianz von korreliert sind, es sei denn, . Wenn multivariat normal ist, tritt dies nur auf, wenn .Z11Z12XX,Yρ=κ31Viρ=0

2 Der Korrelationskoeffizient

Betrachten Sie nun die Transformation auf . Dies liefert die bivariate Verteilung des Probenkorrelationskoeffizienten und der Probenvarianz von x. Nach der Delta-Methode und der asymptotischen Normalität von ist wobei ist der Jacobi von .g(x,y,z)=(x,yzx)Sn~Sn

n(g(Sn~)(ρ,σ2)T)N(0,J(Σ~)TΛ~J(Σ~)),
J(Σ~)=[g1T,g2T]Tg

Ich finde , (obwohl Sie wahrscheinlich wollen meine Algebra überprüfen ..) , dass der Gradient der zweiten Komponente von heißt So g

g2(σ2,ρστ,τ2)=(ρ2σ2,1στ,ρ2τ2)T,

J(σ,ρ,τ)=(1ρ2σ201στ0ρ2τ2).

Alles zusammen mit der Faktorisierung in Gleichung (1) ergibt

J(σ,ρ,τ)TD(σ,τ)[KR(ρ)R(ρ)T]D(σ,τ)J(σ,ρ,τ).

Wenn Sie einige einfach zu verwendende Zahlen eingeben , z. B. und , hätten wir für wobei im Allgemeinen eine dichte Matrix ist. Mit freundlicher Genehmigung von Mathematica habe ich dieses Produkt in Bezug auf Einträge in und unterσ=τ=1ρ=.5

J(σ,ρ,τ)TD(σ,τ)[KR(ρ)R(ρ)T]D(σ,τ)J(σ,ρ,τ)=(1/411/4100)IΩI(1/41101/40)=Q,
Ω=KR(ρ)R(ρ)TKQ12
n×Q12=n×Cov(r,sx2)=κ31κ04+κ224(2)
Das ist ein undurchsichtiger Ausdruck in Bezug auf die gemischten Momente, aber es scheint sicher nicht so, als würde es im Allgemeinen Null sein.

3 Spezialisiert auf den Normalfall

Das Isserlis-Theorem bietet eine Möglichkeit, die gemischten Momente eines Gaußschen abzuleiten. Wieder unter der Annahme von und wir , also , wie Sie beobachten.σ=τ=1ρ=.5κ31=3/2,κ04=3,κ22=3/2Q12=3/2(3+3/2)/4=3/8>0

4 Simulation und Beispiel

Unten finden Sie eine Simulation zur Überprüfung von Gleichung (1). Für und (in rot bzw. blau) iid Beobachtungen aus einer multivariaten Normalen leite ich die Kovarianz von durch Bootstrap ab. Die Kovarianz zwischen und auf der Y - Achse aufgetragen , wie von variiert bis . Der theoretische Wert aus Gleichung (1) und die Verwendung von Fakten über die Momente 4. Ordnung des bivariaten Gaußschen ist in einer gestrichelten schwarzen Linie dargestellt.n=100n=1000nS~nSxySxxρ.9.9

Simulation zur Überprüfung von Gleichung (1)

Ein Spaß Übung wäre, zu versuchen , eine Familie von Copula zu finden , dass für einen beliebigen Wert von machen würde ...ρCov(Sxy,Sxx)=0

library(mvtnorm)
library(tidyverse)
library(boot)
params = expand.grid(sx = 1, sy = 1, n = c(100, 1000), rho = seq(-.9, .9, by = .1), replicate = 1:10) %>% mutate(k04 = 3*sx^4, k31 = 3*sx*rho*sx*sy, q12 = k31 - rho*sx*sy)

Sn_tilde = function(dat, idx){
    Sn = cov(dat[idx,,drop =FALSE])*sqrt(length(idx))
    Sn[upper.tri(Sn, diag = TRUE)]
}

out = params %>% group_by_all() %>% do({
    x = with(., rmvnorm(n = .$n, sigma = matrix(c(sx^2, rho*sx*sy,
                                            rho*sx*sy, sy^2), nrow = 2)))
colnames(x) = c('X', 'Y')
b = boot(x, Sn_tilde, R = 500)
cov_Sn = cov(b$t)
    rownames(cov_Sn) = colnames(cov_Sn) = c('Sxx', 'Sxy', 'Syy')
    as_tibble(cov_Sn, rownames = 'j')
})


ggplot(filter(out,  j == 'Sxx'), aes(x = rho, y = Sxy, color = factor(n))) + geom_point(size = .5, alpha = .5) + geom_smooth(method = 'lm') + geom_line(data = filter(params, replicate == 1, n == 100), aes(y = q12), lty = 2, color = 'black') + theme_minimal() + ylab('Cov(Sxy, Sxx)')


1 Hierbei werden Michael Perlmans Vorlesungsunterlagen zu Wahrscheinlichkeits- und mathematischen Statistiken verwendet, von denen ich mir wirklich wünschte, sie wären elektronisch verfügbar, damit ich meine ersetzen könnte, wenn sie abgenutzt sind ...

Andrew M.
quelle
Vielen Dank! Ich denke jedoch, dass es irgendwo einen Fehltritt geben könnte: Tatsächlich scheint es, dass , nicht 3/8, empirisch (obwohl dies nicht tut, weil und ). Cov(r,sx)0Corr(r,sx)Var(r,sx)0Var(r,sx)0
Halb passieren
Ich werde eine neue Frage dazu stellen, da ich auch nicht weiß, wie ich . Cov(r,sx)0
Halb passieren
(+1) Sehr interessanter Beitrag. Es scheint , dass für bivariate , Ausdruck auswertet bis . Dies führt zu dem Ergebnis, dass wenn während wenn . N(0,1)(2)3ρ10.5ρ2ρ<0.35Cov(r,sx2)<0ρ>0.35Cov(r,sx2)>0
Alecos Papadopoulos
@ half-pass: Das Paar muss um werden , um eine (nicht entartete) Grenzverteilung zu erhalten. Wenn Sie die Korrelation per se untersuchen möchten, können Sie das Ergebnis in Abschnitt 1 verwenden und einfach die in Abschnitt 2 entsprechend ändern . (r,sx)ng
Andrew M
1
@AlecosPapadopoulos: Ausdruck 2 ist bereits auf den Fall spezialisiert, dass und . Wenn Sie sich nur um das Vorzeichen der Assoziation zwischen und , können Sie einfach den [1,2] -Eintrag in der Differenz in Gleichung 1 anhand von Fakten über die gemischte Momente einer bivariaten Normalen, um als Funktion von anzuschließen . τ2=σ2=1ρ=.5sxrKR(ρ)R(ρ)TKρ
Andrew M
1

Bearbeiten: Diese Antwort ist falsch. Ich bin mir nicht sicher, ob es besser ist, es hier für die Aufzeichnung zu belassen oder es einfach zu löschen.

Ja, es gilt asymptotisch, unabhängig von der Verteilung von X und Y. Ich war mit der Taylor-Erweiterung auf dem richtigen Weg:

Geben Sie hier die Bildbeschreibung ein

halber Durchgang
quelle
Ich schaue auf Gl. , zweite Zeile. Wir haben eine Wahrscheinlichkeitsgrenze minus einer festen Menge. Wenn wir Konsistenz haben, ist die Wahrscheinlichkeitsgrenze gleich der festen Menge. Daher ist die 2. Zeile von Gl. scheint gleich Null zu sein ... was zu erwarten ist, da die Wahrscheinlichkeitsgrenze von gleich . Aber sowohl als auch sind Konstanten, daher ist ihre Kovarianz Null. Es scheint, dass das erzielte Ergebnis entscheidend davon abhängt, 1) den Taylor-Rest (dessen Zeichen wir nicht kennen) und (WEITER) zu ignorieren(2.1)(2.1)Cov(r,sx)Cov(ρ,σx)ρσx
Alecos Papadopoulos
1
(Forts.) ... und 2) zum selektiven Anwenden der Konsistenz-Eigenschaft auf bestimmte Begriffe, jedoch nicht auf andere. Sind Sie sicher, dass dies gültige Manipulationen sind?
Alecos Papadopoulos
Danke für den Pushback. Ich habe diese Manipulation in der zweiten Zeile vorgenommen, weil für die allgemeinen Wohnmobile U und V Plim E [U] E [V] = Plim E [U] Plim E [V] ist, was mir den zweiten Term gibt. Aber für den ersten Term ist Plim E [UV]! = Plim E [U] Plim E [V]. Daher denke ich, dass ich durchweg Konsistenz angewendet habe, nur auf verschiedene Schritte.
halber Pass
Ich bin sicher nicht, aber ...
Halb passieren
Okay - das ist in der Tat falsch! Ich glaube jedoch nicht, dass dies auf die erste Manipulation zurückzuführen ist, sondern vielmehr auf die Tatsache, dass ich Var (s_Y) -> 0 ebenfalls ignoriert habe, was zu einer Tautologie führte. Leider kann ich meine eigene Antwort nicht ablehnen.
Halb passieren
0

Dies hängt von der gemeinsamen Verteilung ab. Für das von Ihnen erwähnte Beispiel ist die bivariate Normalverteilung (Mittelwert Null) durch . Daraus folgt, dass man alle möglichen Wertekombinationen dieser drei Parameter haben kann, was bedeutet, dass keine Beziehung zwischen und den Standardabweichungen hergestellt werden kann.ρ,σx,σyρ

Für andere bivariate Verteilungen kann der Korrelationskoeffizient grundsätzlich eine Funktion der Standardabweichungen sein (im Wesentlichen sind beide Funktionen primitiverer Parameter). In diesem Fall kann untersucht werden, ob eine monotone Beziehung besteht.

Alecos Papadopoulos
quelle
2
Ich verstehe, dass die drei Parameter willkürliche Beziehungen für die BVN-Verteilung haben können, aber ich denke nicht, dass die Stichprobenschätzungen davon asymptotisch unabhängig sind.
Halb passieren