Ich habe angefangen, mich durch die Statistical Data Mining Tutorials von Andrew Moore zu arbeiten (sehr empfehlenswert für alle anderen, die sich zum ersten Mal in dieses Gebiet wagen). Ich begann mit der Lektüre dieses äußerst interessanten PDFs mit dem Titel "Einführung in zeitreihenbasierte Algorithmen zur Erkennung von Anomalien", in dem Moore viele der Techniken zur Erstellung eines Algorithmus zur Erkennung von Krankheitsausbrüchen nachzeichnet. In der Mitte der Folien, auf Seite 27, listet er eine Reihe weiterer "State-of-the-Art-Methoden" zur Erkennung von Ausbrüchen auf. Die erste Liste enthält Wavelets . Wikipeida beschreibt ein Wavelet als
Eine wellenartige Schwingung mit einer Amplitude, die bei Null beginnt, zunimmt und dann auf Null zurückgeht. Es kann typischerweise als "kurze Schwingung" visualisiert werden
Ihre Anwendung auf Statistiken wird jedoch nicht beschrieben, und meine Google-Suchanfragen liefern hoch akademische Arbeiten, die davon ausgehen, dass sie wissen, wie Wavelets mit Statistiken oder vollständigen Büchern zu diesem Thema zusammenhängen.
Ich möchte ein grundlegendes Verständnis dafür haben, wie Wavelets auf die Erkennung von Zeitreihenanomalien angewendet werden, ähnlich wie Moore die anderen Techniken in seinem Tutorial veranschaulicht. Kann jemand eine Erklärung zur Funktionsweise von Detektionsmethoden mit Wavelets oder einen Link zu einem verständlichen Artikel zu diesem Thema geben?
quelle
Die am häufigsten verwendeten und implementierten diskreten Wavelet-Basisfunktionen (im Unterschied zu der in Robins Antwort beschriebenen CWT) weisen zwei nützliche Eigenschaften auf, die sie für die Erkennung von Anomalien nützlich machen:
In der Praxis bedeutet dies, dass Ihre diskrete Wavelet-Zerlegung lokale Änderungen im Signal über eine Vielzahl von Skalen und Frequenzbändern betrachtet. Wenn Sie zum Beispiel über eine Funktion, die über einen längeren Zeitraum eine Verschiebung geringer Größe anzeigt, hochfrequentes Rauschen mit großer Größe überlagert haben, werden diese beiden Skalen durch die Wavelet-Transformation effizient voneinander getrennt, und Sie können die Grundlinienverschiebung sehen, die bei vielen anderen auftritt Techniken werden fehlen; Eine Verschiebung dieser Grundlinie kann auf einen Krankheitsausbruch oder eine andere Änderung des Interesses hindeuten. In vielerlei Hinsicht können Sie die Zerlegung selbst als glatter behandeln (und es wurde eine Menge Arbeit an der effizienten Schrumpfung von Wavelet-Koeffizienten in nichtparametrischen Schätzungen geleistet, siehe z. B. so ziemlich alles über Wavelets von Donoho). Im Gegensatz zu reinen frequenzbasierten Methoden Durch die kompakte Unterstützung sind sie in der Lage, nicht stationäre Daten zu verarbeiten. Im Gegensatz zu rein zeitbasierten Methoden ermöglichen sie eine frequenzbasierte Filterung.
In der Praxis würden Sie zum Erkennen von Anomalien oder zum Ändern von Punkten eine diskrete Wavelet-Transformation (wahrscheinlich die als "Maximum Overlap DWT" oder "Shift Invariant DWT" bekannte Variante, je nachdem, wen Sie lesen) auf die Daten anwenden und nachsehen bei den niederfrequenten Koeffizientensätzen, um festzustellen, ob Sie signifikante Verschiebungen in der Grundlinie haben. Dies zeigt Ihnen, wann eine langfristige Veränderung unter alltäglichen Geräuschen auftritt. Percival und Walden (siehe Referenzen unten) leiten einige Tests für statistisch signifikante Koeffizienten ab, mit denen Sie feststellen können, ob eine Verschiebung wie diese signifikant ist oder nicht.
Ein ausgezeichnetes Nachschlagewerk für diskrete Wavelets ist Percival und Walden, "Wavelet Methods for Time Series Analysis". Eine gute Einführungsarbeit ist "Introduction to Wavelets und Wavelet-Transformationen, ein Primer" von Burrus, Gopinath und Guo. Wenn Sie einen technischen Hintergrund haben, ist "Elemente von Wavelets für Ingenieure und Wissenschaftler" aus Sicht der Signalverarbeitung eine gute Einführung.
(Bearbeitet, um Robins Kommentare aufzunehmen)
quelle