Interpretation des Gesamtgesetzes der Kovarianz

9

Sei Zufallsvariablen, die im gleichen Wahrscheinlichkeitsraum definiert sind, und sei die Kovarianz von und endlich, dann lautet das Gesetz der Formel für die totale Kovarianz / Kovarianz-Zerlegung: Was ist die Interpretation von \ text {(i)} und \ text {(ii)} ?X Y Cov ( X , Y ) = E [ Cov ( X , Y | Z ) ] i (i) + Cov [ E ( X | Z ) , E ( Y | Z ) ] (ii) (i) (ii)X,Y,ZXY

Cov(X,Y)=E[Cov(X,Y|Z)](i)+Cov[E(X|Z),E(Y|Z)](ii)
(i)(ii)

Meine Gedanken: In (ii) können die beiden bedingten Erwartungen als Zufallsvariablen selbst angesehen werden. Ich weiß auch, dass dies eine Verallgemeinerung des Gesetzes der Gesamtvarianz / Varianzzerlegungsformel ist, die durch Setzen von X = Y gezeigt werden kann X=Y, wobei die Interpretation ist dann die einer Variation in Y , die durch Z erklärt Zund durch Z . Aber wie lautet die korrekte Interpretation in der obigen Kovarianzformel für (i) und (ii)? Wikipedia bietet eine kurze Beschreibung, die nicht sehr zufriedenstellend ist.

interessierter_student
quelle

Antworten:

10

Der erste Term (i): E[cov(X,Y|Z)]

Stellen Sie sich \ operatorname {cov} (X, Y)cov(X,Y) als Funktion von Z . Wenn Sie verschiedene Werte von Z , erhalten Sie entsprechend einen Wert für cov(X,Y) . Die Erwartung einfach den Durchschnitt dieser unterschiedlichen Kovarianzen in Bezug auf Z .

Der zweite Term (ii): cov([E[X|Z],E[Y|Z])

Stellen Sie sich und als Funktionen von . Wenn Sie verschiedene Werte von , erhalten Sie entsprechend einen Wert von und einen Wert von , die gleichzeitig realisiert werden. Daher erhalten Sie für jeden Wert von eine -Koordinate. Dieser Begriff ist einfach die Kovarianz all dieser Koordinatenpunkte.E [ Y | Z ] Z Z E [ X | Z ] E [ Y | Z ] Z ( X , Y )E[X|Z]E[Y|Z]ZZE[X|Z]E[Y|Z]Z(X,Y)

Antipathie
quelle
4

Eine andere mögliche Interpretation in einem hierarchischen Rahmen ist einfach eine Zerlegung der gesamten Kovarianz in zwei Begriffe:cov(X,Y)

  1. die Gruppe ( ) undE[cov(X,Y|Z)]
  2. zwischen Gruppecov([E[X|Z],E[Y|Z])

Kovarianzen. Der erste Term repräsentiert in diesem Beispiel den Durchschnitt der für jede Gruppe bewerteten Kovarianzen von und , während der zweite Term die Kovarianz der Gruppenmittelwerte für und .Y X Y.XYXY

Arne Jonas Warnke
quelle