Ich habe eine große Sammlung von Zeitreihen - Messungen, die alle 15 Minuten (96 Messungen pro Tag) über einen Zeitraum von 1 Jahr an verschiedenen Orten durchgeführt werden.
Ich habe jede Zeitreihe in 365 separate kleinere Zeitreihen unterteilt, eine für jeden Tag des Jahres. Wenn man sich diese Zeitreihen ansieht, gibt es sicherlich viele verschiedene Formen für einen einzelnen Tag. Manche sehen sinusförmig aus, manche sind konstant, manche sehen aus wie ein zufälliger stochastischer Prozess, manche sehen parabolisch aus und manche sehen aus wie U's.
Ich möchte einen Algorithmus verwenden, der diese gemeinsamen Formen findet. Ich dachte über Clustering nach und verwendete die Cluster-Schwerpunkte, um gemeinsame Formen zu definieren, wollte aber bei der Community nachfragen, ob dies richtig ist. Bisher habe ich Dynamic Time Warp als Metrik betrachtet, aber es scheint, dass diese Metrik viel Berechnung erfordert. Ich habe auch gefunden
http://mox.polimi.it/it/progetti/pubblicazioni/quaderni/13-2008.pdf von SE.
Ich habe auch gesehen Ist es möglich, Zeitreihen-Clustering basierend auf der Kurvenform durchzuführen? Diese Frage stammt jedoch aus dem Jahr 2010 und ist möglicherweise veraltet.
Eine andere Idee, die ich hatte, war, Eigenzusammensetzungen von Matrizen zu nehmen, die wie folgt formatiert waren:
Die Matrix ist eine Matrix aller am Tag beobachteten Zeitreihen . Jede Zeile der Matrix ist eine Zeitreihe der Länge 96. Dann würde ich 365 Eigendekompositionen durchführen und die Eigenvektoren als gemeinsame Formen verwenden. Klingt das vernünftig?
Vielen Dank!
quelle