Grenzen der bedingten Erwartung mit normalen Rändern und spezifizierter (Pearson) Korrelation

8

Ich habe die folgende Frage in einem anderen Forum gesehen:

"Angenommen, sowohl Größe als auch Gewicht erwachsener Männer können mit normalen Modellen beschrieben werden, und die Korrelation zwischen diesen Variablen beträgt 0,65. Wenn die Größe eines Mannes ihn auf das 60. Perzentil bringt, bei welchem ​​Perzentil würden Sie sein Gewicht erwarten?"

Ich sehe, dass jemand im fraglichen Forum bereits darauf hingewiesen hat, dass die Frage davon spricht, dass die Ränder normal sind ( height and weight ... can be described with normal models), nicht von bivariater Normalität, und dass die Frage daher keine einzige Antwort hat.

Die Antwort würde eindeutig von der tatsächlichen bivariaten Abhängigkeitsbeziehung (der Kopula) abhängen, was mich neugierig machte.

Meine Frage ist:

Gibt es bei normalen Rändern und einer bestimmten Populationskorrelation ( , eine Pearson-Korrelation) eine einigermaßen einfache Möglichkeit, Grenzen für wenn beide normal sind, mit Korrelation ?ρX , Y ρE(Y|X=xq)X,Yρ

Wenn es einen exakt größten Wert und einen kleinsten Wert für die bedingte Erwartung gibt, wäre es gut, dies (und vorzugsweise die Umstände, unter denen jeder auftritt *) zu wissen.

* Ich habe einige starke Vermutungen darüber, wie diese Umstände aussehen könnten (dh welche Art von Abhängigkeit damit verbunden sein könnte; insbesondere erwarte ich, dass eine bestimmte Art von entarteter Verteilung die Grenzen überschreitet), aber ich habe diesen Gedanken noch nicht untersucht Tiefe. (Ich denke, jemand wird es wahrscheinlich schon wissen.)

Andernfalls wären Ober- oder Untergrenzen sowohl für den größten als auch für den kleinsten Wert interessant.

Ich benötige nicht unbedingt eine algebraische Antwort (ein Algorithmus würde dies tun), obwohl eine algebraische Antwort nett wäre.

Ungefähre oder teilweise Antworten können nützlich / hilfreich sein.

Wenn niemand gute Antworten hat, kann ich es selbst versuchen.

Glen_b -Reinstate Monica
quelle

Antworten:

4

Ich denke, es gibt keine Grenzen. Diese Schlussfolgerung beruht auf der folgenden Konstruktion, die für beliebige kontinuierliche Verteilungen am einfachsten zu beschreiben ist. Im weiteren Verlauf werden Bedingungen hinzugefügt, bis wir uns bei normalen Rändern befinden.

Also, lassen jede stetige Zufallsvariable mit Verteilungsfunktion sein . Definieren Sie bei einem halboffenen Intervall (das schließlich sehr eng wird)F ( a , b ]XF(a,b]

ψ:(a,b](,c]

über

ψ(x)=F1(F(x)F(a)).

Dies nimmt monoton zu und offensichtlich ist . Durch den Bau,c=ψ(b)=F1(F(b)F(a))

Pr(X(a,b])=Pr(ψ(X)c).

Verlängern auf eine Eins-zu-Eins - Karte via& PSgr; : RRψΨ:RR

Ψ|(a,b]=ψ,Ψ|(,c]=ψ1

und ansonsten . Die Verteilung von ist identisch mit der von , aber es wurde die Werte zwischen den beiden Intervallen und vertauscht .Ψ ( X )Ψ(x)=xΨ(X)( a , b ] ( - , c ]X(a,b](,c]

Abbildung 1: Diagramm von Psi

Beispiel für für .( a , b ] = ( 1,5 , 1,75 ]Ψ(a,b]=(1.5,1.75]

Die Pearson-Korrelation von sei . (Ohne Verlust der Allgemeinheit können wir nun annehmen, dass sowohl als auch standardisiert wurden, da dies weder noch die Kontinuität von ändert ). Sei eine beliebige reelle Zahl, wie in der Frage, wo die bedingte Erwartung von ausgewertet werden soll. Wählen Sie für welches aber machen Sie es so eng, dass winzig ist. Dann ändert sich von bisρ ( - 1 , 1 ) X Y ρ X x q Y ( a ,(X,Y)ρ(1,1)XYρXxqYx q( a , b ] Pr ( X ( a , b ] ) ρ = Y X c | b - a | ρ(a,b]xq(a,b]Pr(X(a,b])ρ = E ( Ψ ( X ) Y )ρ=E(XY)ρ=E(Ψ(X)Y)kann beliebig klein gemacht werden. (Es erfordert ein wenig Arbeit, um dies zu zeigen; es kommt auf die Tatsache an, dass die bedingte Erwartung von bei relativ langsam zunimmt, wenn abnimmt. Wenn dies nicht der Fall wäre , würde nicht definiert.) Sie jedoch anwenden, ändert sich aufYXc|ba|ρE ( Y | X = x q )ΨE(Y|X=xq)

E(Y|Ψ(X)=xq)=E(Y|X=Ψ(xq)),

Dies ist eine bedingte Erwartung für bei einem Wert von kleiner oder gleich .X cYXc

Abbildung 2: Grafik des PDF von (Psi (X), Y)

Konturen des PDF. Hier . Die ursprüngliche bivariate Normalverteilung erhielt eine Korrelation von , die sich beim Vertauschen der Wahrscheinlichkeiten in den beiden Streifen auf ungefähr - den Zielwert - verringerte .0,85 0,5(a,b]=(1.5,1.75]0.850.5

Wenn eine bivariate Normalverteilung ist, gilt als . Vorausgesetzt, , wird die bedingte Erwartung von für auf und für auf . Eine analoge Konstruktion, bei der das Intervall gegen , wird die bedingte Erwartung von unendlich weit in die andere Richtung treiben. Durch den ursprünglichen Wert der Einstellung etwas können wir für die unendlich kleine Änderung in kompensierenc - | b - a | 0 & rgr; & ne; 0 Y - & rgr; > 0 + & rgr; < 0 ( a , b ] [ c , ) Y & rgr; & rgr; & rgr; Y X = x q(X,Y)c|ba|0ρ0Yρ>0+ρ<0(a,b][c,)YρρDies findet statt und zeigt, dass wir unabhängig vom ursprünglichen Wert von nichts über die bedingte Erwartung von an einem bestimmten Punkt .ρYX=xq

(Die offensichtliche Ausnahme kann behandelt werden, indem beispielsweise mit einer bivariaten Verteilung mit normalen Rändern begonnen wird, deren Unterstützung auf die Linien .)y = ± xρ=0y=±x

whuber
quelle
+1 Das ist sehr interessant. Es hat etwas mit der Konstruktion zu tun, an die ich beim Schreiben der Frage gedacht hatte, aber es ist besser darauf ausgerichtet, nur die Bedingungen in der unmittelbaren Nachbarschaft des Quantils zu verschieben und eine nachdenklichere Diskussion zu führen, als ich gespielt hatte. Ihre Schlussfolgerung scheint auf den ersten Blick richtig zu sein. Vielen Dank.
Glen_b -State Monica
Eigentlich ist +1 hier nicht ausreichend.
Glen_b -State Monica
0

Wenn ich Ihre Frage richtig verstehe, hängt die Antwort von der verwendeten "tatsächlichen bivariaten Abhängigkeitsbeziehung (der Kopula)" ab.

Nun, es gibt Grenzen für den Wert, den eine Kopula annehmen kann, oder? Warum also nicht die Comonotonicity Copula und die Countermonotonicity Copula verwenden, um die Grenzen festzulegen?

Geben Sie hier die Bildbeschreibung ein

Quelle: Thorsten Schmidt - Umgang mit Copulas

Henry E.
quelle
Die Frage ist restriktiver als die Grenzen für Copulas - Sie können die Grenzen der Co- und Gegenmonotonie aufgrund der Einschränkung für . ρ
Glen_b -State Monica