Welche Beziehung besteht zwischen der ersten Hauptkomponente (n) und der durchschnittlichen Korrelation in der Korrelationsmatrix?
Zum Beispiel beobachte ich in einer empirischen Anwendung, dass die durchschnittliche Korrelation fast gleich dem Verhältnis der Varianz der ersten Hauptkomponente (erster Eigenwert) zur Gesamtvarianz (Summe aller Eigenwerte) ist.
Gibt es eine mathematische Beziehung?
Unten ist die Tabelle der empirischen Ergebnisse. Wenn die Korrelation die durchschnittliche Korrelation zwischen den Renditen der DAX-Aktienindexkomponente ist, die über das 15-Tage-Rolling-Fenster berechnet wurden, und der erklärten Varianz der Anteil der Varianz ist, der durch die erste Hauptkomponente erklärt wird, die ebenfalls über das 15-Tage-Rolling-Fenster berechnet wird.
Könnte dies durch ein gemeinsames Risikofaktormodell wie CAPM erklärt werden?
Antworten:
Ich glaube, dass die Beziehung zwischen der mittleren Korrelation und dem Eigenwert des 1. PC existiert, aber nicht eindeutig ist. Ich bin kein Mathematiker, um daraus schließen zu können, aber ich kann zumindest den Ausgangspunkt anzeigen, von dem aus die eigene Intuition oder der eigene Gedanke wachsen könnte.
Wenn Sie standardisierte Variablen als Vektoren im euklidischen Raum zeichnen, in dem sie sitzen (und dies ist der reduzierte Raum, in dem Achsen Beobachtungen sind), ist die Korrelation der Kosinus zwischen zwei Vektoren .
Und da alle Vektoren eine Einheitslänge haben (aufgrund der Standardisierung), sind die Cosinus die Projektionen der Vektoren aufeinander (wie im linken Bild mit drei Variablen gezeigt). Der erste PC ist so eine Zeile in diesem Raum, der die Summe der quadrierten Projektionen auf sie, maximiert ein ‚s, genannt Belastungen; und diese Summe ist der 1. Eigenwert.
Wenn Sie also die Beziehung zwischen dem Mittelwert der drei Projektionen links und der Summe (oder dem Mittelwert) der drei quadratischen Projektionen rechts herstellen, beantworten Sie Ihre Frage nach der Beziehung zwischen der mittleren Korrelation und dem Eigenwert.
quelle
Ich gehe davon aus, dass dieses Ergebnis für große Matrizen ungefähr gilt, auch wenn die Korrelationen nicht genau identisch sind.
quelle