In diesem Beitrag wird eine leistungsstarke Argumentationsmethode vorgestellt, die viel Algebra und Berechnung vermeidet. Für diejenigen, die mit dieser Methode vertraut sind, ist die Arbeit so automatisch und natürlich, dass die erste Antwort auf eine Frage wie diese lautet: "Es ist offensichtlich!" Aber vielleicht ist es nicht so offensichtlich, bis Sie die Methode gesehen haben. Daher werden alle Details Schritt für Schritt erklärt.
Hintergrund
Es gibt verschiedene Formeln für die Varianz der Daten (mit dem Mittelwert ˉ x = ( x 1 + ⋯ + x n ) / n ), einschließlichx = x1, x2, … , X.nx¯= ( x1+ ⋯ + xn) / n
Var( x ) = 1n∑i = 1n( xich- x¯)2= 1n( ∑i = 1nx2ich) - x¯2.(1)
Dies bestimmt die Kovarianz gepaarter Daten über( x1, y1) , … , ( X.n, yn)
Cov( x , y ) = 14( Var( x + y ) - Var(x−y)).
Die Formel, auf die in dem Beitrag verwiesen wird, in dem auf Kovarianz mit Buntstiften verwiesen wird, lautet
C.(x,y)=∑i=1n−1∑j=i+1n(xj−xi)(yj−yi)=12∑i,j=1n(xj−xi)(yj−yi).(2)
Dieser Beitrag behauptet, sei proportional zur Kovarianz. Die Proportionalitätskonstante c ( n ) könnte (und tut) mit n variieren . Wenn also x = y ist, ist eine Implikation dieser Behauptung die folgendeCc(n)nx=y
C(x,x)=c(n)Var(x).
Analyse
Obwohl dies mit Brute-Force-Algebra demonstriert werden könnte, gibt es einen besseren Weg: Lassen Sie uns die grundlegenden Eigenschaften der Kovarianz ausnutzen. Welche Eigenschaften wären das? Ich möchte vorschlagen, dass Folgendes grundlegend ist:
Standortunabhängigkeit. Das heißt, für eine beliebige Zahl a . (Der Ausdruck x - a bezieht sich auf den Datensatz x 1 - a , x 2 - a , … , x n - a .)
Cov(x,y)=Cov(x−a,y)
ax−ax1−a,x2- a , … , xn- a
Multilinearität. Dies impliziert für eine beliebige Zahl λ . (Der Ausdruck λ x bezieht sich auf den Datensatz λ x 1 , λ x 2 , … , λ x n .)
Cov( λx , y ) = λCov( x , y )
λλ xλ x1, λ x2, … , Λ xn
Symmetrie. Die Kovarianz von und y ist die Kovarianz von y und x : Cov ( x , y ) = Cov ( y , x ) .xyyx
Cov( x , y ) = Cov( y , x ) .
Invarianz unter Permutationen. Die Kovarianz ändert sich nicht, wenn wir neu indizieren . Formal ist Cov ( x , y ) = Cov ( x σ , y σ ) für jede Permutation σ ∈ S n . (Ausdrücke wie x σ repräsentieren die Neuordnung von x i nach σ , so dass x σ = x σ ( 1 ) ,( xich, yich)
Cov( x , y ) = Cov( xσ, yσ)
σ∈ S.nxσxichσ)xσ= xσ( 1 ), xσ( 2 ), … , X.σ( n ).
Alle diese Eigenschaften gelten offensichtlich sowohl für als auch für C, wenn die Formen der Ausdrücke ( 1 ) und ( 2 ) untersucht werden . Die einzige Erklärung, die möglicherweise einer Erklärung bedarf, ist die Standortunabhängigkeit. Eine konstante Verschiebung der Werte von x i ändert jedoch weder die Residuen noch die Differenzen:VarC.( 1 )( 2 )xich
xich- x¯= ( xich- a ) - x - a¯¯¯¯¯¯¯¯¯¯¯¯
und
xj- xich= ( xj- a ) - ( xich- a ) .
Folglich ist es in der Tat offensichtlich, dass die erste Version von und ( 2 ) ortsunabhängig ist.( 1 )( 2 )
Lösung
Hier ist also die Begründung. Da symmetrisch und multilinear ist, ist es eine quadratische Form, die vollständig durch die Koeffizienten c i j = c j i bestimmt wird :C.ci j= cj i
C.( x , y ) = ∑i , j = 1nci jxichyj.
ci j= cich'j'ich , j , ich', j'i ≠ jich'≠ j'ci i= cich'ich'ichich'C.c11c12
0 = C.( 0 , 0 ) =OrtsinvarianzC.( 1 , 0 ) =SymmetrieC.( 0 , 1 ) =OrtsinvarianzC.( 1 , 1 )
01n
0 = C.( 1 , 1 ) = ∑ich , jnci j= n c11+ ( n2- n ) c12,
c11c12
C.Cov( 1 )( 2 )x21c11( 1 )x211 / n - ( 1 / n )2( 2 )y = xx21n - 1( x , x )n - 1n - 1
c ( n ) = n - 11 / n - ( 1 / n )2= n2,
QED . Dies war die einzige Berechnung, die zum Nachweis erforderlich war
Cov( x , y ) = 1n2C.( x , y ) = 1n2∑i = 1n - 1∑j = i + 1n( xj- xich) ( yj- yich) .