Verstehen, dass

8

Ich habe gerade diese Frage und die wundervolle akzeptierte Antwort in diesem Forum gesehen. Ich wurde dann veranlasst, intuitiv zu verstehen, warum die Division von die Kovarianz normalisiert:SxSy

COV(X,Y)SxSy[1,1]

Ich denke, es wird hilfreich sein, wenn ich nur verstehe, warum auf normalisiert . Natürlich verstehe ich, dass sie per Definition gleich sind. Aber meine Frage lautet im Grunde: Unter Verwendung der Terminologie der akzeptierten Antwort, warum ist die Gesamtsumme von Rot in der Darstellung genau (genauer, soweit ich verstehe, ist die Summe zu sagen der durch Rechtecke sollte ) sein. Ich meine, wenn wir eine Stichprobe von Beobachtungen nehmen, dann haben wir Rechtecke, während wir die Definition verwenden, müssen wir den Mittelwert von nur Werten finden. COV ( X , X ) 1 S x S x = VAR ( X ) n 2 VAR ( X ) 10 45 10SxSxCOV(X,X)1SxSx=VAR(X)n2VAR(X)104510

d_e
quelle

Antworten:

8

In diesem Beitrag wird eine leistungsstarke Argumentationsmethode vorgestellt, die viel Algebra und Berechnung vermeidet. Für diejenigen, die mit dieser Methode vertraut sind, ist die Arbeit so automatisch und natürlich, dass die erste Antwort auf eine Frage wie diese lautet: "Es ist offensichtlich!" Aber vielleicht ist es nicht so offensichtlich, bis Sie die Methode gesehen haben. Daher werden alle Details Schritt für Schritt erklärt.

Hintergrund

Es gibt verschiedene Formeln für die Varianz der Daten (mit dem Mittelwert ˉ x = ( x 1 + + x n ) / n ), einschließlichx=x1,x2,,xnx¯=(x1++xn)/n

(1)Var(x)=1ni=1n(xix¯)2=1n(i=1nxi2)x¯2.

Dies bestimmt die Kovarianz gepaarter Daten über(x1,y1),,(xn,yn)

Cov(x,y)=14(Var(x+y)Var(xy)).

Die Formel, auf die in dem Beitrag verwiesen wird, in dem auf Kovarianz mit Buntstiften verwiesen wird, lautet

(2)C(x,y)=i=1n1j=i+1n(xjxi)(yjyi)=12i,j=1n(xjxi)(yjyi).

Dieser Beitrag behauptet, sei proportional zur Kovarianz. Die Proportionalitätskonstante c ( n ) könnte (und tut) mit n variieren . Wenn also x = y ist, ist eine Implikation dieser Behauptung die folgendeCc(n)nx=y

C(x,x)=c(n)Var(x).

Analyse

Obwohl dies mit Brute-Force-Algebra demonstriert werden könnte, gibt es einen besseren Weg: Lassen Sie uns die grundlegenden Eigenschaften der Kovarianz ausnutzen. Welche Eigenschaften wären das? Ich möchte vorschlagen, dass Folgendes grundlegend ist:

  1. Standortunabhängigkeit. Das heißt, für eine beliebige Zahl a . (Der Ausdruck x - a bezieht sich auf den Datensatz x 1 - a , x 2 - a , , x n - a .)

    Cov(x,y)=Cov(xa,y)
    axax1a,x2a,,xna
  2. Multilinearität. Dies impliziert für eine beliebige Zahl λ . (Der Ausdruck λ x bezieht sich auf den Datensatz λ x 1 , λ x 2 , , λ x n .)

    Cov(λx,y)=λCov(x,y)
    λλxλx1,λx2,,λxn
  3. Symmetrie. Die Kovarianz von und y ist die Kovarianz von y und x : Cov ( x , y ) = Cov ( y , x ) .xyyx

    Cov(x,y)=Cov(y,x).
  4. Invarianz unter Permutationen. Die Kovarianz ändert sich nicht, wenn wir neu indizieren . Formal ist Cov ( x , y ) = Cov ( x σ , y σ ) für jede Permutation σ S n . (Ausdrücke wie x σ repräsentieren die Neuordnung von x i nach σ , so dass x σ = x σ ( 1 ) ,(xi,yi)

    Cov(x,y)=Cov(xσ,yσ)
    σSnxσxiσ)xσ=xσ(1),xσ(2),,xσ(n).

Alle diese Eigenschaften gelten offensichtlich sowohl für als auch für C, wenn die Formen der Ausdrücke ( 1 ) und ( 2 ) untersucht werden . Die einzige Erklärung, die möglicherweise einer Erklärung bedarf, ist die Standortunabhängigkeit. Eine konstante Verschiebung der Werte von x i ändert jedoch weder die Residuen noch die Differenzen:VarC(1)(2)xi

xix¯=(xia)xa¯

und

xjxi=(xja)(xia).

Folglich ist es in der Tat offensichtlich, dass die erste Version von und ( 2 ) ortsunabhängig ist.(1)(2)


Lösung

Hier ist also die Begründung. Da symmetrisch und multilinear ist, ist es eine quadratische Form, die vollständig durch die Koeffizienten c i j = c j i bestimmt wird :Ccij=cji

C(x,y)=i,j=1ncijxiyj.

cij=ciji,j,i,jijijcii=ciiiiCc11c12

0=C(0,0)=location-invarianceC(1,0)=symmetryC(0,1)=location-invarianceC(1,1)

01n

0=C.(1,1)=ich,jncichj=nc11+(n2- -n)c12,
c11c12

C.Cov(1)(2)x12c11(1)x121/.n- -(1/.n)2(2)y=xx12n- -1(x,x)n- -1n- -1

c(n)=n- -11/.n- -(1/.n)2=n2,

QED . Dies war die einzige Berechnung, die zum Nachweis erforderlich war

Cov(x,y)=1n2C.(x,y)=1n2ich=1n- -1j=ich+1n(xj- -xich)(yj- -yich).
whuber
quelle