Warum so viele Methoden zur Berechnung von PSD?

53

Die Methode von Welch war mein bevorzugter Algorithmus zur Berechnung der spektralen Leistungsdichte (PSD) von Zeitreihen mit gleichmäßiger Abtastung. Mir ist aufgefallen, dass es viele andere Methoden zur Berechnung von PSD gibt. In Matlab sehe ich zum Beispiel:

  • PSD nach der Burg-Methode
  • PSD mit Kovarianzmethode
  • PSD mit Periodogramm
  • PSD mit modifizierter Kovarianzmethode
  • PSD mit Multitaper-Methode (MTM)
  • PSD nach Welch
  • PSD mit Yule-Walker AR-Methode
  • Spektrogramm mit Kurzzeit-Fourier-Transformation
  • Spektrale Schätzung

Was sind die Vorteile dieser verschiedenen Methoden? Wann möchte ich in der Praxis etwas anderes als die Methode von Welch anwenden?

Nibot
quelle
Nicht einmal ein Anfänger in der Signalverarbeitung, aber schätze, dass {dies} relevant sein könnte, auch {dies} . Ich habe nur gegoogelt.
Entwickler
4
Eigentlich "berechnet" man die PSD nicht, sondern "schätzt" sie. Es gibt einen großen Unterschied.
Leonbloy
1
Dieser Link enthält Beispiele für einige der oben genannten Techniken: mathworks.com/help/signal/ug/nonparametric-methods.html

Antworten:

67

Ich bin mit der Multitaper-Methode nicht vertraut. Das heißt, Sie haben eine ziemliche Frage gestellt. Während meines MSEE-Studiums belegte ich einen kompletten Kurs, der sich mit der PSD-Schätzung befasste. Der Kurs behandelte alles, was Sie aufgelistet haben (mit Ausnahme der Multitaper-Methode), sowie Subspace-Methoden. Selbst dies deckt nur einige der Hauptideen ab, und es gibt viele Methoden, die sich aus diesen Konzepten ergeben.

Für den Anfang gibt es zwei Hauptmethoden zur Schätzung der spektralen Leistungsdichte: nicht parametrisch und parametrisch.

Nichtparametrische Methoden werden verwendet, wenn das Signal im Voraus nicht genau bekannt ist. Sie sind in der Regel weniger rechenintensiv als parametrische Modelle. Die Methoden in dieser Gruppe sind weiter in zwei Kategorien unterteilt: Periodogramme und Korrelogramme. Periodogramme werden manchmal auch als direkte Methoden bezeichnet, da sie zu einer direkten Transformation der Daten führen. Dazu gehören das Probenspektrum, die Bartlett-Methode, die Welch-Methode und das Daniell-Periodogramm. Korrelogramme werden manchmal als indirekte Methoden bezeichnet, da sie das Wiener-Khinchin-Theorem ausnutzen. Daher basieren diese Verfahren auf der Fourier-Transformation einer Schätzung der Autokorrelationssequenz. Aufgrund der hohen Varianz, die mit Verzögerungen höherer Ordnung verbunden ist (aufgrund einer geringen Menge von Datenstichproben, die in den Korrelationen verwendet werden), Fenster wird verwendet. Die Blackman-Tukey-Methode verallgemeinert die Korrelogrammmethoden.

Parametrische Verfahren setzen typischerweise eine Art Signalmodell vor der Berechnung der Schätzung der spektralen Leistungsdichte voraus. Daher wird angenommen, dass eine gewisse Kenntnis des Signals im Voraus bekannt ist. Es gibt zwei Hauptkategorien für parametrische Methoden: autoregressive Methoden und Subspace-Methoden.

Bei autoregressiven Verfahren wird davon ausgegangen, dass das Signal als Ausgangssignal eines autoregressiven Filters (z. B. eines IIR-Filters) modelliert werden kann, das von einer Folge von weißem Rauschen gesteuert wird. Daher versuchen alle diese Methoden, die IIR-Koeffizienten zu lösen, wodurch die resultierende spektrale Leistungsdichte leicht berechnet werden kann. Die Modellreihenfolge (oder Anzahl der Gewindebohrer) muss jedoch bestimmt werden. Wenn die Modellreihenfolge zu klein ist, wird das Spektrum stark geglättet und es fehlt die Auflösung. Wenn die Modellreihenfolge zu hoch ist, treten falsche Spitzen von einer großen Anzahl von Polen auf. Wenn das Signal durch einen AR-Prozess des Modells 'p' modelliert werden kann, erzeugt der Ausgang des Filters der Ordnung> = p, der durch das Signal angesteuert wird, weißes Rauschen. Es gibt Hunderte von Metriken für die Auswahl der Modellreihenfolge. Beachten Sie, dass diese Methoden hervorragend für Schmalbandsignale mit hohem bis mittlerem SNR geeignet sind. Ersteres liegt daran, dass das Modell in erheblichem Rauschen zerfällt und besser als ARMA-Prozess modelliert wird. Letzteres ist auf die Impulsivität des resultierenden Spektrums der Pole in der Fourier-Transformation des resultierenden Modells zurückzuführen. AR-Methoden basieren auf der linearen Vorhersage, mit der das Signal außerhalb seiner bekannten Werte extrapoliert wird. Infolgedessen leiden sie nicht unter Nebenkeulen und erfordern kein Fenster.

Subspace-Methoden zerlegen das Signal in einen Signal-Subraum und einen Rausch-Subraum. Durch Ausnutzung der Orthogonalität zwischen den beiden Teilräumen kann ein Pseudospektrum gebildet werden, bei dem große Peaks bei schmalbandigen Komponenten auftreten können. Diese Methoden funktionieren in Umgebungen mit niedrigem SNR sehr gut, sind jedoch rechenintensiv. Sie können in zwei Kategorien eingeteilt werden: Rauschunterraummethoden und Signalunterraummethoden.

Beide Kategorien können auf zwei Arten verwendet werden: Eigenwertzerlegung der Autokorrelationsmatrix oder Einzelwertzerlegung der Datenmatrix.

Rauschunterraummethoden versuchen, nach einem oder mehreren Eigenvektoren des Rauschunterraums aufzulösen. Dann erzeugt die Orthogonalität zwischen dem Rauschunterraum und dem Signalunterraum Nullen im Nenner der resultierenden Spektrumschätzungen, was zu großen Werten oder Spitzen bei wahren Signalkomponenten führt. Die Anzahl der diskreten Sinuskurven oder der Rang des Signalunterraums muss bestimmt / geschätzt werden oder im Voraus bekannt sein.

Signalunterraumverfahren versuchen, den Rauschunterraum vor der Spektralschätzung zu verwerfen, wodurch das SNR verbessert wird. Eine Autokorrelationsmatrix mit reduziertem Rang wird gebildet, wobei nur die Eigenvektoren bestimmt werden, zum Signalunterraum zu gehören (wiederum ein Modellordnungsproblem), und die Matrix mit reduziertem Rang wird in einem der anderen Verfahren verwendet.

Jetzt werde ich versuchen, Ihre Liste schnell abzudecken:

  • PSD nach der Burg-Methode: Die Burg-Methode nutzt die Levinson-Rekursion geringfügig anders als die Yule-Walker-Methode, indem sie die Reflexionskoeffizienten durch Minimierung des Durchschnitts des linearen Vorwärts- und Rückwärtsvorhersagefehlers schätzt. Dies führt zu einem harmonischen Mittel der Teilkorrelationskoeffizienten des linearen Vorwärts- und Rückwärtsvorhersagefehlers. Wie bei allen autoregressiven Methoden werden Schätzungen mit sehr hoher Auflösung erstellt, da das Signal mithilfe einer linearen Vorhersage außerhalb seines bekannten Datensatzes extrapoliert wird. Dies entfernt effektiv alle Nebenkeulenphänomene. Es ist der YW-Methode für kurze Datensätze überlegen und beseitigt den Kompromiss zwischen der Verwendung der verzerrten und der unverzerrten Autokorrelationsschätzung, da sich die Gewichtungsfaktoren aufteilen. Ein Nachteil ist, dass es spektrale Linienaufteilung zeigen kann. In Ergänzung, es leidet an den gleichen Problemen, die alle AR-Methoden haben. Das heißt, ein niedriges bis moderates SNR verschlechtert die Leistung erheblich, da es nicht mehr durch einen AR-Prozess, sondern durch einen ARMA-Prozess richtig modelliert wird. ARMA-Methoden werden selten verwendet, da sie im Allgemeinen zu einem nichtlinearen Satz von Gleichungen in Bezug auf die Parameter des gleitenden Durchschnitts führen.

  • PSD mit Kovarianzmethode : Die Kovarianzmethode ist ein Sonderfall der Methode der kleinsten Quadrate, bei der der mit Fenstern versehene Teil der linearen Vorhersagefehler verworfen wird. Dies ist der Burg-Methode überlegen, aber im Gegensatz zur YW-Methode ist die zu lösende inverse Matrix im Allgemeinen nicht Hermitian Toeplitz, sondern das Produkt zweier Toeplitz-Matrizen. Daher kann die Levinson-Rekursion nicht zum Auflösen der Koeffizienten verwendet werden. Außerdem kann nicht garantiert werden, dass der mit dieser Methode erzeugte Filter stabil ist. Für die spektrale Abschätzung ist dies jedoch eine gute Sache, was zu sehr großen Spitzen für den Sinusgehalt führt.

  • PSD mit Periodogramm : Dies ist einer der schlechtesten Schätzer und ein Sonderfall der Welch-Methode mit einem einzelnen Segment, einer rechteckigen oder dreieckigen Fensterung (je nachdem, welche Autokorrelationsschätzung verwendet wird, verzerrt oder unverzerrt) und ohne Überlappung. Es ist jedoch eines der "billigsten" rechnerisch gesehen. Die resultierende Varianz kann sehr hoch sein.

  • PSD mit modifizierter Kovarianzmethode : Dies verbessert sowohl die Kovarianzmethode als auch die Burg-Methode. Sie kann mit der Burg-Methode verglichen werden, wobei die Burg-Methode nur den durchschnittlichen linearen Vorwärts- / Rückwärts-Vorhersagefehler in Bezug auf den Reflexionskoeffizienten minimiert, die MC-Methode ihn in Bezug auf ALLE AR-Koeffizienten minimiert. Darüber hinaus leidet es nicht unter Spektrallinienaufteilung und bietet viel weniger Verzerrung als die zuvor aufgelisteten Methoden. Obwohl es keinen stabilen IIR-Filter garantiert, ist seine Gitterfilterrealisierung stabil. Es ist auch rechenintensiver als die beiden anderen Methoden.

  • PSD nach der Welch-Methode : Die Welch-Methode verbessert das Periodogramm, indem sie das Fehlen der in der wahren PSD-Formel vorhandenen Ensemble-Mittelung behebt. Es verallgemeinert die Methode von Barlett, indem Überlappung und Fensterung verwendet werden, um mehr PSD- "Samples" für den Pseudo-Ensemble-Durchschnitt bereitzustellen. Je nach Anwendung kann dies eine kostengünstige und effektive Methode sein. Wenn Sie jedoch eine Situation mit eng beieinander liegenden Sinuskurven haben, sind AR-Methoden möglicherweise besser geeignet. Es ist jedoch nicht erforderlich, die Modellreihenfolge wie bei AR-Methoden zu schätzen. Wenn also nur wenig über Ihr Spektrum a priori bekannt ist, kann dies ein hervorragender Ausgangspunkt sein.

  • PSD unter Verwendung der Yule-Walker-AR-Methode : Dies ist ein Spezialfall der Methode der kleinsten Quadrate, bei der die vollständigen Fehlerreste verwendet werden. Dies führt zu einer verminderten Leistung im Vergleich zu den Kovarianzmethoden, kann jedoch unter Verwendung der Levinson-Rekursion effizient gelöst werden. Es ist auch als Autokorrelationsmethode bekannt.

  • Spektrogramm mit Kurzzeit-Fourier-Transformation : Jetzt wechseln Sie in eine andere Domäne. Dies wird für zeitvariable Spektren verwendet. Das heißt, eines, dessen Spektrum sich mit der Zeit ändert. Dies eröffnet eine ganze Reihe weiterer Würmer, und es gibt genau so viele Methoden, wie Sie für die Zeit-Frequenz-Analyse aufgelistet haben. Dies ist sicherlich das billigste, weshalb es so häufig verwendet wird.

  • Spektralschätzung : Dies ist keine Methode, sondern ein Überbegriff für den Rest Ihres Beitrags. Manchmal wird das Periodogramm als "Abtastspektrum" oder als "Schuster-Periodogramm" bezeichnet, von denen das erstere möglicherweise das ist, worauf Sie sich beziehen.

Bei Interesse können Sie sich auch mit Subspace-Methoden wie MUSIC und Pisarenko Harmonic Decomposition befassen. Diese zerlegen das Signal in Signal- und Rauschunterraum und nutzen die Orthogonalität zwischen dem Rauschunterraum und den Signalunterraum-Eigenvektoren, um ein Pseudospektrum zu erzeugen. Ähnlich wie bei den AR-Methoden erhalten Sie möglicherweise keine "echte" PSD-Schätzung, da diese Leistung höchstwahrscheinlich nicht erhalten bleibt und die Amplituden zwischen den Spektralkomponenten relativ sind. Es hängt jedoch alles von Ihrer Anwendung ab.

Prost

Bryan
quelle
Danke für die tolle Antwort! Können Sie einige einleitende Bemerkungen zum Unterschied zwischen parametrischen und nicht parametrischen Methoden hinzufügen? Es könnte auch klarer sein, die eng verwandten oder voneinander abgeleiteten Methoden zu gruppieren, dh Periodogramm - Bartlett-Methode - Welch-Methode.
Nibot
Bestimmt. Ich habe gerade eine Einführung und einige Kategorien hinzugefügt.
Bryan
Herzlich willkommen. Vielen Dank für eine so ausführliche Antwort.
Jason R
Wenn Sie detaillierter auf die Vor- und Nachteile eingehen könnten, anstatt wie sie berechnet werden, würden wir besser verstehen, wie man eine für eine bestimmte Anwendung auswählt.
CyberMen
1
Wenn Sie die Antwort lesen, habe ich genau das getan. Für praktische Implementierungen ist die Art und Weise, wie jedes berechnet wird, in hohem Maße ein Vorteil / Nachteil. Einige von ihnen sind sehr recheneffizient, arbeiten aber nicht so gut. Einige von ihnen funktionieren sehr gut, sind jedoch sehr komplex und bei Zielen mit geringem Stromverbrauch schwierig zu implementieren.
Bryan
12

Ich wollte der einzigen Kategorie hinzufügen, die im ersten Beitrag nicht behandelt wurde. Das Multitaper-Verfahren ist ein nicht parametrisches Verfahren zum Berechnen eines Leistungsspektrums ähnlich dem Periodogramm-Ansatz. Bei diesem Verfahren wird ein Leistungsspektrum berechnet, indem die Daten gefenstert und eine Fourier-Transformation berechnet wird, wobei die Größe des Ergebnisses genommen und quadriert wird. Das Multitaper-Verfahren mittelt eine vorbestimmte Anzahl von Periodogrammen, die jeweils mit einem anderen Fenster berechnet werden. Diese Methode funktioniert, weil die ausgewählten Fenster zwei mathematische Eigenschaften haben. Erstens sind die Fenster orthogonal. Dies bedeutet, dass jedes der Periodogramme nicht korreliert ist, sodass die Mittelung mehrerer Periodogramme eine Schätzung mit einer geringeren Varianz ergibt als die Verwendung nur einer Verjüngung. Zweitens haben die Fenster die bestmögliche Konzentration im Frequenzbereich für eine feste Signallänge.

In matlab können die Fensterfunktionen mit der Funktion dpss aufgerufen werden. Zusätzlich zur Verwendung von optimalen Fenstern wurde ein Algorithmus abgeleitet, um die verschiedenen Periodogramme basierend darauf zu gewichten, wie viel Leckage sie zur Schätzung des Leistungsspektrums hinzufügen. Der Algorithmus liefert einen Satz datenadaptiver Gewichte. Eine Spektrumschätzung mit einer Reihe von datenadaptiven Gewichten kann in Matlab erstellt werden, indem ein spectrum.mtm-Objekt mit der Option 'adaptive' als Kombinationsoption erstellt wird.

In Bezug auf nicht-parametrische Methoden ist die MT-Methode wohl die beste Methode zur Schätzung eines Leistungsspektrums für eine stationäre Zeitreihe.

ncRubert
quelle
Wenn Sie sich den letzten Satz in Ihrem Beitrag ansehen, möchten Sie immer eine MT-Berechnung anstelle einer Welch-Methode verwenden.
ncRubert