Nur weil ein Korrespondent eine interessante Frage zu Methoden zur Berechnung der Autokorrelation stellte, begann ich damit zu spielen, fast ohne Kenntnis von Zeitreihen und Autokorrelation.
Der Korrespondent ordnete seine Daten ( Datenpunkte einer Zeitreihe) jeweils um eine Zeitverzögerung so an, dass er eine Matrix von 32 × 32 Daten (wie ich ihn verstand) hatte, wobei die erste Zeile die Originaldaten sind, die zweite Zeile die Daten verschoben um 1 Zeiteinheit, die nächste Zeile durch einen anderen und so weiter. Ich erkannte dies zusätzlich, indem ich das Ende auf den Schwanz klebte und so "kreisförmige" Datensätze machte.
Dann habe ich, nur um zu sehen, was daraus entstehen könnte, die Korrelationsmatrix und daraus die Hauptkomponenten berechnet. Überraschenderweise bekam ich das Bild einer Frequenzzerlegung und (wieder mit anderen Daten) einer Frequenz, sagen wir, dass mit einer Periode in den Daten in der ersten Hauptkomponente war und dass mit vier Perioden in der zweiten PC und so weiter (Ich habe 6 "relevante" PCs mit einem Eigenwert > 1). Zuerst dachte ich, dass dies von den Eingabedaten abhängt, aber jetzt gehe ich davon aus, dass dies systematisch durch die spezielle Konstruktion des Datensatzes mit seinen Kreisverschiebungen (auch als "Toeplitz" -Matrix bekannt) geschieht. Rotationen der PC-Lösung nach Varimax oder anderen Rotationskriterien ergaben leicht unterschiedliche und möglicherweise interessante Ergebnisse, scheinen jedoch im Allgemeinen eine solche Frequenzzerlegung zu liefern.
Hier ist ein Link zu Bildern, die ich aus dem Punkte-Datensatz gemacht habe. Die Kurven werden einfach aus den Belastungen der Faktormatrix erstellt: Eine Kurve die Belastungen auf einen Faktor. Die Kurve des ersten PC1 sollte die höchsten Amplituden aufweisen (ungefähr, weil sie die höchste Summe der Belastungsquadrate trägt).
Fragen:
- Frage 1: Ist dies eine beabsichtigte Funktion? (von PCA mit dieser Art von Datensatz)
- F2: Ist dieser Ansatz tatsächlich für einen ernsthaften Ansatz zur Frequenz- / Wellenlängenanalyse geeignet?
[Update] Hier ist der Datensatz (ich hoffe, er wird für Sie kopierbar sein)
-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3
quelle
Antworten:
Lassen Sie mich meinen früheren Kommentar in eine Antwort umwandeln.
Keine Ahnung, ob es nützlich sein kann (Q2). Nach meiner Erfahrung erscheint es eher als störendes Artefakt. Das heißt, die Leute haben einige Daten, holen etwas, das den Fourier-Modi ähnelt, aus der PCA heraus und fragen sich, was sie bedeuten könnten, während sie einfach auf einige Zeitverschiebungen in der ursprünglichen Zeitreihe zurückzuführen sind.
quelle