Intuition hinter der Formel für die Varianz einer Summe zweier Variablen

10

Das weiß ich aus früheren Studien

Var(A+B)=Var(A)+Var(B)+2Cov(A,B)

Ich verstehe jedoch nicht, warum das so ist. Ich kann sehen, dass der Effekt darin besteht, die Varianz zu "erhöhen", wenn A und B stark variieren. Es ist sinnvoll, dass Sie beim Erstellen eines Komposits aus zwei stark korrelierten Variablen dazu neigen, die hohen Beobachtungen von A mit den hohen Beobachtungen von B und die niedrigen Beobachtungen von A mit den niedrigen Beobachtungen von B zu addieren. Dies tendiert dazu Erstellen Sie extrem hohe und niedrige Werte in der zusammengesetzten Variablen, wodurch die Varianz des Verbunds erhöht wird.

Aber warum funktioniert es, die Kovarianz mit genau 2 zu multiplizieren ?

user1205901 - Monica wiederherstellen
quelle
1
Wenn und perfekt positiv korreliert sind, dann ist und wenn sie perfekt negativ korreliert sind, dann ist . Die Kovarianz misst, wie weit in diesem Bereich ihre Beziehung istB V a r ( A + B ) = V a r ( A ) + V a r ( B ) + 2 AB Var(A+B)=Var(A)+Var(B)-2Var(A+B)=Var(A)+Var(B)+2Var(A)Var(B)Var(A+B)=Var(A)+Var(B)2Var(A)Var(B)
Henry

Antworten:

21

Einfache Antwort:

Die Varianz beinhaltet ein Quadrat:

Var(X)=E[(XE[X])2]

Ihre Frage läuft also auf den Faktor 2 in der quadratischen Identität hinaus:

(a+b)2=a2+b2+2ab

Was visuell als Zerlegung der Fläche eines Seitenquadrats in die Fläche der kleineren Quadrate der Seiten und zusätzlich zu zwei Rechtecken der Seiten und :a b a b(a+b)abab

Geben Sie hier die Bildbeschreibung ein

Mehr involvierte Antwort:

Wenn Sie eine mathematisch komplexere Antwort wünschen, ist die Kovarianz eine bilineare Form, was bedeutet, dass sie sowohl im ersten als auch im zweiten Argument linear ist. Dies führt zu:

Var(A+B)=Cov(A+B,A+B)=Cov(A,A+B)+Cov(B,A+B)=Cov(A,A)+Cov(A,B)+Cov(B,A)+Cov(B,B)=Var(A)+2Cov(A,B)+Var(B)

In der letzten Zeile habe ich die Tatsache verwendet, dass die Kovarianz symmetrisch ist:

Cov(A,B)=Cov(B,A)

Um zusammenzufassen:

Es ist zwei, weil Sie sowohl als auch berücksichtigen müssen .cov(A,B)cov(B,A)

byouness
quelle
5

Die Menge der Zufallsvariablen ist ein Vektorraum, und viele der Eigenschaften des euklidischen Raums können mit ihnen analogisiert werden. Die Standardabweichung wirkt ähnlich wie eine Länge und die Varianz wie die Länge im Quadrat. Unabhängigkeit entspricht der Orthogonalität, während perfekte Korrelation der Skalarmultiplikation entspricht. Die Varianz unabhängiger Variablen folgt also dem Satz von Pythagoras: .
var(A+B)=var(A)+var(B)

Wenn sie perfekt korreliert sind, ist
std(A+B)=std(A)+std(B)

Beachten Sie, dass dies äquivalent zu
var(A+B)=var(A)+var(B)+2var(A)var(B)

Wenn sie nicht unabhängig sind, folgen sie einem Gesetz, das dem Kosinusgesetz entspricht:
var(A+B)=var(A)+var(B)+2cov(A,B)

B c o v ( A , B ) v a r ( A , B ) v a r ( A ) v a r ( B )ABcov(A,B)var(A,B)var(A)var(B)2var(A)var(B)2cov(A,B)2var(A)var(B)r2AB

var(A+B)=var(A)+var(B)+MeasureOfCorrelationPerfectCorrelationTerm

MeasureOfCorrelation=r2PerfectCorrelationTerm=2var(A)var(B)

r=correl(A,B)

σA+B=σA2+σB2+2(rσA)(rσB)

r2cos

Akkumulation
quelle
2

Var(A+B)VarCov

A+B

  1. A
  2. B
  3. AB
  4. BA

Var(A+B)=Var(A)+Var(B)+Cov(A,B)+Cov(B,A)
=Var(A)+Var(B)+2Cov(A,B)
Cov
Bananin
quelle