Intuitive Erklärung des Beitrags zur Summe zweier normalverteilter Zufallsvariablen

16

Wenn ich zwei normalverteilte unabhängige Zufallsvariablen und mit den Bedeutungen und und den Standardabweichungen und und feststelle, dass , dann gilt (vorausgesetzt, ich habe keine Fehler gemacht) die bedingte Verteilung von und denen sind auch normal mit den Mitteln und Standardabweichung XYμXμYσXσYX+Y=cXYc

μX|c=μX+(cμXμY)σX2σX2+σY2
μY|c=μY+(cμXμY)σY2σX2+σY2
σX|c=σY|c=σX2σY2σX2+σY2.

Es ist nicht überraschend, dass die bedingten Standardabweichungen dieselben sind wie bei , wenn einer nach oben geht, muss der andere um denselben Betrag nach unten gehen. Es ist interessant, dass die bedingte Standardabweichung nicht von abhängt .cc

Was ich nicht kann, sind die bedingten Mittel, bei denen sie einen Teil des Überschusses proportional zu den ursprünglichen Varianzen und nicht zu den ursprünglichen Standardabweichungen . (cμXμY)

Wenn sie zum Beispiel Null haben, und Standardabweichungen und dann bedingt durch , hätten wir und , dh im Verhältnis , obwohl ich intuitiv gedacht hätte, dass das Verhältnis natürlicher wäre. Kann jemand eine intuitive Erklärung dafür geben?μX=μY=0σX=3σY=1c=4E[X|c=4]=3.6E[Y|c=4]=0.49:13:1

Dies wurde durch eine Math.SE-Frage provoziert

Henry
quelle

Antworten:

16

Die Frage lässt sich leicht auf den Fall reduzieren, indem und .μX=μY=0XμXYμY

Offensichtlich sind die bedingten Verteilungen normal. Somit stimmen der Mittelwert, der Median und der Modus von jedem überein. Die Modi treten an den Koordinaten eines lokalen Maximums der bivariaten PDF von und auf, die auf die Kurve . Dies impliziert, dass die Kontur der bivariaten PDF an dieser Stelle und die Abhängigkeitskurve parallele Tangenten haben. (Dies ist die Theorie der Lagrange-Multiplikatoren.) Da die Gleichung einer Kontur die Form für ein konstantes (d. h. alle Konturen sind Ellipsen), ihre Steigungen müssen parallel sein, woher existiert so dassXYg(x,y)=x+y=cf(x,y)=x2/(2σX2)+y2/(2σY2)=ρρλ

(xσX2,yσY2)=f(x,y)=λg(x,y)=λ(1,1).

Bildbeschreibung hier eingeben

Daraus folgt unmittelbar, dass die Modi der bedingten Verteilungen (und damit auch die Mittelwerte) durch das Verhältnis der Varianzen bestimmt werden, nicht der SDs.

Diese Analyse funktioniert auch für korreliertes und und gilt für alle linearen Bedingungen, nicht nur für die Summe.XY

whuber
quelle
Das ist sehr beeindruckend und etwas vollständiger, als ich es mir gewünscht hatte. Ich wäre mit dem Diagramm und der Aussage zufrieden gewesen, dass die Tangente an die Ellipse nicht durch die Mitte der Ellipse verläuft, so dass der Tangenten-Rotpunkt mit einer höheren Standardabweichung unverhältnismäßig mehr von der Zufallsvariablen nehmen muss.
Henry
1
Das war nicht gut formuliert. Was ich meinte, war die Linie von der Mitte zum roten Punkt ist nicht senkrecht zur Tangente.
Henry