Gibt es ein Beispiel für (ungefähr) unabhängige Variablen, die von Extremwerten abhängig sind?

14

Ich suche ein Beispiel für 2 Zufallsvariablen X , Y so dass

|cor(X,Y)|0

Betrachtet man jedoch den Endteil der Verteilungen, so sind sie stark korreliert. (Ich versuche, "korrelierte" / "Korrelation" für den Schwanz zu vermeiden, da er möglicherweise nicht linear ist).

Verwenden Sie dies wahrscheinlich:

|cor(X,Y)|0

wobei von der Bevölkerung von abhängig ist und im gleichen Sinne definiert ist. X > 90 %XX>90%XY

Kmz
quelle
8
Unabhängige Variablen, die abhängig sind? Mein Gehirn explodierte gerade. Diese Art von Frage kann man am Montagmorgen
Aksakal,
1
In Anbetracht der positiven Antwort scheint diese Frage nicht zu beantworten zu sein.
gung - Wiedereinsetzung von Monica
1
Überlegen Sie, wie sehr Sie sich für Waffenprobleme interessieren und wie sehr Sie die NRA mögen / hassen, damit dies für die Menschen einen Sinn ergibt. Die Korrelation wird wahrscheinlich nahe Null sein. Menschen, die sich am meisten für Waffenprobleme interessieren, können die NRA entweder lieben oder hassen. Aber sie werden sehr abhängig sein. Menschen, die sich am meisten für Waffenfragen interessieren, werden so gut wie nie in der Mitte des Pro-NRA / Anti-NRA-Spektrums sein. Menschen ganz oben oder ganz unten im Pro-NRA- / Anti-NRA-Spektrum werden sich mehr für Waffenprobleme interessieren als Menschen in der Mitte.
David Schwartz
1
Es tut mir leid, dass ich die unklare Frage gestellt habe. Ich möchte nur veranschaulichen, wie es für einige unabhängige Distributionen mit einer Art extremer Abhängigkeit (nicht unbedingt Korrelation) funktioniert.
Kmz
2
Es gibt eine Vielzahl von Copulas mit einer schwachen Gesamtabhängigkeit, aber einer starken Schwanzabhängigkeit. Die genaue Gesamtkorrelation würde von der Verteilung der Marginals abhängen.
Glen_b

Antworten:

23

Hier ist ein Beispiel, in dem und sogar normale Ränder haben.XY

Lassen:

XN(0,1)

Unter sei Y = X, wenn | X | > ϕ oder Y = - X andernfalls für eine Konstante ϕ .XY=X|X|>ϕY=Xϕ

Sie können zeigen, dass wir unabhängig von am Rande haben:ϕ

YN(0,1)

Es gibt einen Wert von so dass cor ( X , Y ) = 0 ist . Wenn ϕ = 1,54, dann ist cor ( X , Y ) 0 .ϕcor(X,Y)=0ϕ=1.54cor(X,Y)0

Allerdings und Y sind nicht unabhängig, und Extremwerte der beiden sind vollkommen abhängig. Siehe Simulation in R unten und die folgende Darstellung.XY

Nsim <- 10000
set.seed(123)

x <- rnorm(Nsim)
y <- ifelse(abs(x)>1.54,x,-x)

print(cor(x,y)) # 0.00284 \approx 0

plot(x,y)

extreme.x <- which(abs(x)>qnorm(0.95))
extreme.y <- which(abs(y)>qnorm(0.95))
extreme.both <- intersect(extreme.x,extreme.y)

print(cor(x[extreme.both],y[extreme.both])) # Exactly 1

Bildbeschreibung hier eingeben

Chris Haug
quelle
1
(+1) Wenn Sie möchten, dass die Verteilung nicht nur unkorreliert, sondern auch nicht sehr abhängig ist, können Sie eine Modifikation vornehmen, die den Hard-Threshold-Swap durch einen Fuzzy-Swap ersetzt. Es ist schwieriger, die Mathematik in eine Reihe zu bringen, aber es ist machbar.
Matthew Graves
1
Vielen Dank Chris Haug! Ihre Idee hilft mir zu visualisieren, was ich tue.
Kmz