Betrachten Sie in einer anderen Folge von Intuitionen für Identitäten in der Wahrscheinlichkeit das elementare Identitätsgesetz der Gesamtvarianz
Es ist eine einfache, unkomplizierte algebraische Manipulation der Definition von Momenten in Summation oder, wie im Wikipedia-Link, über die Manipulation von E und Var.
Aber diese Identität habe ich keine Ahnung, was es bedeutet . Ich nehme an, es bedeutet, dass Sie vermutlich die Varianz einer Variablen mithilfe einer anderen Variablen berechnen könnten, um zu helfen, aber es sieht nicht so aus, als würde es die Dinge vereinfachen oder die Handhabbarkeit verbessern.
Die Wiki-Seite sagt
Die erste Komponente wird als Erwartungswert der Prozessvarianz (EVPV) und die zweite als Varianz des hypothetischen Mittels (VHM) bezeichnet.
Das ist so aufschlussreich wie das Ablesen von Namen sein kann.
Also , was bedeutet es wirklich bedeutet ? Gibt es eine Intuition über die beiden Teile? Benötigen Sie zuerst eine Intuition von ? Eine geometrische Intuition mag nett sein, aber auch eine wortreiche Erklärung, kleine Algebra, würde immens helfen.
Gibt es gute lineare Algebra-Interpretationen oder physikalische Interpretationen oder andere, die Einblick in diese Identität geben würden?
Antworten:
Um eine einfache Intuition zu erhalten, werden wir mit einer Zwei-Wege-Varianzanalyse vergleichen. Sei wobei die ϵ i j mit der Erwartung Null und der gemeinsamen Varianz σ 2 , i = 1 , … , k iid sind ; j = 1 , … , n i .Y.i j= μich+ ϵi j ϵi j σ2 i = 1 , … , k ; j = 1 , … , nich
Dann haben wir die Zersetzung wobei der erste Term auf der rechten Seite die gruppeninterne Varianz misst (und zur Schätzung der gemeinsamen gruppeninternen Varianzσ2 verwendet werden kann), der zweite Term die gruppeninterne Varianz misst und zur Schätzung vonσ2 verwendet werden kannnur unter der Hypothese, dass alleμieinen gemeinsamen Wert haben. Andernfalls enthält es eine zusätzliche Komponente, die "Varianz derμi". Dies hat die gleiche Form wie das Gesetz der totalen Varianz!
Formal lassen Gruppenzugehörigkeit die Zufallsvariable . Dann erhalten wir V a r Y = E V a r ( Y | G ) + V a r E ( Y | G ) und können dies lesen als "Varianz von Y ist der erwartete Wert der Varianz innerhalb der Gruppe plus die Varianz von Gruppenerwartungen. " Dies entspricht unserer obigen Interpretation der ANOVA-Zerlegung. Bei näherer Betrachtung der Ableitung (die wir hier nicht angegeben haben) können Sie erkennen, dass es sich tatsächlich um eine Version des Satzes von Pythagoras handelt. Für diesen Standpunkt sieheG
quelle