Intuition (geometrisch oder anders) von

8

Betrachten Sie in einer anderen Folge von Intuitionen für Identitäten in der Wahrscheinlichkeit das elementare Identitätsgesetz der Gesamtvarianz

V.einr(X.)=E.[V.einr(X.|Y.)]]+V.einr(E.[X.|Y.]])

Es ist eine einfache, unkomplizierte algebraische Manipulation der Definition von Momenten in Summation oder, wie im Wikipedia-Link, über die Manipulation von E und Var.

Aber diese Identität habe ich keine Ahnung, was es bedeutet . Ich nehme an, es bedeutet, dass Sie vermutlich die Varianz einer Variablen mithilfe einer anderen Variablen berechnen könnten, um zu helfen, aber es sieht nicht so aus, als würde es die Dinge vereinfachen oder die Handhabbarkeit verbessern.

Die Wiki-Seite sagt

Die erste Komponente wird als Erwartungswert der Prozessvarianz (EVPV) und die zweite als Varianz des hypothetischen Mittels (VHM) bezeichnet.

Das ist so aufschlussreich wie das Ablesen von Namen sein kann.

Also , was bedeutet es wirklich bedeutet ? Gibt es eine Intuition über die beiden Teile? Benötigen Sie zuerst eine Intuition von ? Eine geometrische Intuition mag nett sein, aber auch eine wortreiche Erklärung, kleine Algebra, würde immens helfen.E.[E.[X.|Y.]]]]=E.[X.]]

Gibt es gute lineare Algebra-Interpretationen oder physikalische Interpretationen oder andere, die Einblick in diese Identität geben würden?

Mitch
quelle
4
aber es sieht nicht so aus, als würde es die Dinge vereinfachen oder die Handhabbarkeit verbessern - es ist praktisch in jedem Fall nützlich, in dem es ein Hilfs- , das es einfacher macht, über nachzudenken, als nur über selbst. Nehmen Sie zum Beispiel und ; dann Versuch, dies direkt zu berechnen, wäre viel weniger einfach gewesen. X Y X.Y.X.Y.X. X.Y.N.(Y.,Y.σ2)Y.B.ichnÖmicheinl(n,p)
E.[Var(X.Y.)]]=E.[Y.σ2]]=npσ2Var(E.[X.Y.]])=Var(Y.)=np(1- -p).
Dougal

Antworten:

5

Um eine einfache Intuition zu erhalten, werden wir mit einer Zwei-Wege-Varianzanalyse vergleichen. Sei wobei die ϵ i j mit der Erwartung Null und der gemeinsamen Varianz σ 2 , i = 1 , , k iid sind ; j = 1 , , n i .Y.ichj=μich+ϵichjϵichjσ2ich=1,,k;;j=1,,nich

Dann haben wir die Zersetzung wobei der erste Term auf der rechten Seite die gruppeninterne Varianz misst (und zur Schätzung der gemeinsamen gruppeninternen Varianzσ2 verwendet werden kann), der zweite Term die gruppeninterne Varianz misst und zur Schätzung vonσ2 verwendet werden kannnur unter der Hypothese, dass alleμieinen gemeinsamen Wert haben. Andernfalls enthält es eine zusätzliche Komponente, die "Varianz derμi". Dies hat die gleiche Form wie das Gesetz der totalen Varianz!

ich=1kj=1nich(Y.ichj- -Y.¯¯)2=ich=1kj=1nich(Y.ichj- -Y.ich¯)2+ich=1knich((Y.ich¯- -Y.¯¯)2
σ2σ2μichμich

Formal lassen Gruppenzugehörigkeit die Zufallsvariable . Dann erhalten wir V a r Y = E V a r ( Y | G ) + V a r E ( Y | G ) und können dies lesen als "Varianz von Y ist der erwartete Wert der Varianz innerhalb der Gruppe plus die Varianz von Gruppenerwartungen. " Dies entspricht unserer obigen Interpretation der ANOVA-Zerlegung. Bei näherer Betrachtung der Ableitung (die wir hier nicht angegeben haben) können Sie erkennen, dass es sich tatsächlich um eine Version des Satzes von Pythagoras handelt. Für diesen Standpunkt sieheG

V.einrY.=E.V.einr(Y.|G)+V.einrE.(Y.|G)
Y.Gesetz der totalen Varianz als Satz von Pythagoras
kjetil b halvorsen
quelle
Mein Mathjax-Hack, um doppelte Overlines zu bekommen, funktioniert nicht sehr gut. Ideen, um es besser zu machen?
kjetil b halvorsen
1
Doppelüberstrich sieht viel besser mit als mit Y aus irgendeinem Grund: ¯ ¯ X . X.Y.X.¯¯
Jbowman