Ich habe eine Zeitreihe von Messungen (Höhen-eindimensionale Reihen). Im Beobachtungszeitraum ging der Messvorgang für einige Zeitpunkte zurück. Die resultierenden Daten sind also ein Vektor mit NaNs, bei dem es Lücken in den Daten gab. Bei Verwendung von MATLAB verursacht dies ein Problem bei der Berechnung der Autokorrelation ( autocorr
) und der Anwendung neuronaler Netze ( nnstart
).
Wie sollen diese Lücken / NaNs behandelt werden? Soll ich diese einfach aus dem Vektor entfernen? Oder ihren Eintrag durch einen interpolierten Wert ersetzen? (wenn ja wie in MATLAB)
Es gibt einige Algorithmen, die gegen fehlende Werte immun sind. Daher besteht die bevorzugte Lösung darin, nach ihnen zu suchen (z. B. Rs
acf
für die Autokorrelation).Im Allgemeinen besteht der Weg darin, entweder nur Daten mit fehlenden Beobachtungen zu verwerfen (kann sehr schmerzhaft sein) oder nur deren Werte zu unterstellen - der Mittelwert der Nachbarn könnte für glatte Reihen und kleine Lücken ausreichen, aber es gibt natürlich auch Vielzahl anderer leistungsfähigerer Methoden, unter Verwendung von Splines, zufälligen / häufigsten Werten, Imputation von Modellen usw.
quelle
Verwenden Sie die Interventionserkennung, um die fehlenden Werte unter Verwendung der nützlichen ARIMA-Struktur und lokaler Zeittrends und / oder Pegelverschiebungen zu unterstellen.
quelle
Hier gibt es 2 Probleme. Das erste ist die Bereitstellung eines aussagekräftigen numerischen Rahmens für Ihre Autokorrelationsantwort in matlab. Dazu müssen Sie den Zeitreihenanteil Ihrer Datenvektoren strecken und / oder patchen. Diese Komponente der Datenintegrität des Problems ist die grundlegendste.
Zweitens müssen Sie entscheiden, wie mit der 'Wert'-Komponente Ihres Vektors umgegangen werden soll. Dies hängt in hohem Maße von der jeweiligen Anwendung ab, was am besten anzunehmen ist (z. B. kleine, fehlende Zeitstempel und die entsprechenden NaNs) oder Nullen könnten sicher von ihren Nachbarn interpoliert werden ... in größeren Lücken ist es wahrscheinlich sicherer, den Wert auf Null zu setzen ... oder wie oben empfohlen zu unterstellen - damit dies sinnvoll ist, müssen die Lücken wieder vergleichsweise klein sein.) .
quelle