Was macht PCA mit autokorrelierten Daten?

9

Nur weil ein Korrespondent eine interessante Frage zu Methoden zur Berechnung der Autokorrelation stellte, begann ich damit zu spielen, fast ohne Kenntnis von Zeitreihen und Autokorrelation.

Der Korrespondent ordnete seine Daten ( Datenpunkte einer Zeitreihe) jeweils um eine Zeitverzögerung so an, dass er eine Matrix von 32 × 32 Daten (wie ich ihn verstand) hatte, wobei die erste Zeile die Originaldaten sind, die zweite Zeile die Daten verschoben um 1 Zeiteinheit, die nächste Zeile durch einen anderen und so weiter. Ich erkannte dies zusätzlich, indem ich das Ende auf den Schwanz klebte und so "kreisförmige" Datensätze machte.3232×321

Dann habe ich, nur um zu sehen, was daraus entstehen könnte, die Korrelationsmatrix und daraus die Hauptkomponenten berechnet. Überraschenderweise bekam ich das Bild einer Frequenzzerlegung und (wieder mit anderen Daten) einer Frequenz, sagen wir, dass mit einer Periode in den Daten in der ersten Hauptkomponente war und dass mit vier Perioden in der zweiten PC und so weiter (Ich habe 6 "relevante" PCs mit einem Eigenwert > 1326>1). Zuerst dachte ich, dass dies von den Eingabedaten abhängt, aber jetzt gehe ich davon aus, dass dies systematisch durch die spezielle Konstruktion des Datensatzes mit seinen Kreisverschiebungen (auch als "Toeplitz" -Matrix bekannt) geschieht. Rotationen der PC-Lösung nach Varimax oder anderen Rotationskriterien ergaben leicht unterschiedliche und möglicherweise interessante Ergebnisse, scheinen jedoch im Allgemeinen eine solche Frequenzzerlegung zu liefern.

Hier ist ein Link zu Bildern, die ich aus dem Punkte-Datensatz gemacht habe. Die Kurven werden einfach aus den Belastungen der Faktormatrix erstellt: Eine Kurve die Belastungen auf einen Faktor. Die Kurve des ersten PC1 sollte die höchsten Amplituden aufweisen (ungefähr, weil sie die höchste Summe der Belastungsquadrate trägt).32

Fragen:

  • Frage 1: Ist dies eine beabsichtigte Funktion? (von PCA mit dieser Art von Datensatz)
  • F2: Ist dieser Ansatz tatsächlich für einen ernsthaften Ansatz zur Frequenz- / Wellenlängenanalyse geeignet?

[Update] Hier ist der Datensatz (ich hoffe, er wird für Sie kopierbar sein)

-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3
Gottfried Helms
quelle
Danke @amoeba und für die Menge an Bearbeitung. Ich hatte nur zwei Fehler gesehen, die ich später bearbeiten wollte, die Frage sieht jetzt viel besser aus!
Gottfried Helms

Antworten:

4

Lassen Sie mich meinen früheren Kommentar in eine Antwort umwandeln.

n=32

n=321n×n

Keine Ahnung, ob es nützlich sein kann (Q2). Nach meiner Erfahrung erscheint es eher als störendes Artefakt. Das heißt, die Leute haben einige Daten, holen etwas, das den Fourier-Modi ähnelt, aus der PCA heraus und fragen sich, was sie bedeuten könnten, während sie einfach auf einige Zeitverschiebungen in der ursprünglichen Zeitreihe zurückzuführen sind.

Amöbe
quelle
Nun, sehr schön, danke! Ja, ich habe die Daten entlang der Zeilen gedacht. Q2 kommt auch, weil ich bis heute nie verstanden habe, wie genau die Fourier-Analyse funktioniert - und dies hätte zufällig ein Schritt sein können, um eine gewisse Intuition zu erlangen (aber diese vage Hoffnung scheint hier wirklich fruchtlos zu sein ...)
Gottfried Helms
Würde es Ihnen übrigens etwas ausmachen, Ihre 32-wertigen Zeitreihen zu teilen? Ich möchte eine Abbildung einfügen, die die Gram-Matrix zeigt, und ich könnte dies direkt mit Ihren Daten tun.
Amöbe
Hast du den Link in meiner Frage gesehen? Es leitet zu einer Webseite weiter, die ich mit exce.l erstellt habe. Es enthält 4 oder 5 Unterseiten, die von "Firefox" in meiner Installation durch Klicken auf die Registerkartenleiste am unteren Bildschirmrand ausgewählt werden können. Die erste Unterseite zeigt die Liste der Daten. Jedoch vertikal: Man sollte es als erste Zeile in einer neuen Tabelle nehmen und 31 Zeilen hinzufügen, während man nach rechts fährt. Wenn das unpraktisch ist, kann ich die Daten auch zu meiner Frage hinzufügen ...
Gottfried Helms
Oh wow, ich wusste nicht, dass es sich um eine ganze Online-Tabelle handelt und nicht nur um einen Screenshot! Vielen Dank.
Amöbe