Ableiten der gesamten Streumatrix (innerhalb der Klasse + zwischen den Klassen)

14

Ich habe mit PCA- und LDA-Methoden herumgespielt und bin an einem Punkt festgefahren. Ich habe das Gefühl, dass es so einfach ist, dass ich es nicht sehen kann.

Innerhalb-Klasse ( SW ) und zwischen-Klasse ( SB ) scatter Matrices ist definiert als:

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

Die Gesamtstreumatrix ST ist gegeben als:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

wobei C die Anzahl von Klassen und N die Anzahl von Abtastwerten ist, Abtastwerte sind, μ i der Klassenmittelwert ist, μxμiμ Gesamtmittelwert ist.

Bei dem Versuch, abzuleiten, kam ich zu einem Punkt, an dem ich:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

als ein Begriff. Das muss Null sein, aber warum?


Tatsächlich:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]
Nimcap
quelle
2
Die Antwort ist, dass Sie die Abweichungen der Werte um ihren Mittelwert summieren und diese Summe Null ist. Aber was genau sind , m und m i ? Wie verhalten sich m und m i zu μ und μ i ? Die Qualität der Antworten hängt davon ab, wie genau wir raten, aber Sie zwingen uns, sehr viel zu raten! xmmimmiμμi
whuber
@whuber: Du hast vollkommen recht, ich habe meine Frage überarbeitet.
Nimcap

Antworten:

8

Wenn Sie annehmen

1Nt=1Nxti=μi

Dann

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

and formula holds. You deal with the second term in the similar way.

mpiktas
quelle
2
(+1) The second term, being the transpose of the first, must also be zero :-).
whuber
@whuber, yes, that too :)
mpiktas
Hi,i don't get why the assumption holds?Can someone explain that?
Mvkt
1
@Mvkt It is not so much an assumption as the definition of μi I suppose. That is to say: μi is the mean of the observations in group i. I expect the answer uses 'assume' because the OP doesn't explain the notation, so we have to guess that the group mean is meant by μi.
Vincent