Angesichts aller guten Eigenschaften von Zustandsraummodellen und KF frage ich mich: Was sind die Nachteile der Zustandsraummodellierung und der Verwendung von Kalman-Filtern (oder EKF-, UKF- oder Partikelfiltern) zur Abschätzung? Sagen wir mal konventionelle Methoden wie ARIMA, VAR oder Ad-hoc / heuristische Methoden.
Sind sie schwer zu kalibrieren? Sind sie kompliziert und schwer einzusehen, wie sich eine Änderung der Modellstruktur auf die Vorhersagen auswirkt?
Oder anders ausgedrückt: Was sind die Vorteile von konventionellem ARIMA, VAR gegenüber State-Space-Modellen?
Ich kann mir nur die Vorteile eines State-Space-Modells vorstellen:
- Strukturbrüche, Verschiebungen und zeitlich veränderliche Parameter eines statischen Modells lassen sich problemlos handhaben. Machen Sie diese Parameter einfach zu dynamischen Zuständen eines Zustands-Raum-Modells, und das Modell passt sich automatisch an alle Änderungen der Parameter an.
- Fehlende Daten werden auf sehr natürliche Weise behandelt. Führen Sie einfach den KF-Übergangsschritt aus und führen Sie den Aktualisierungsschritt nicht aus.
- Sie können die fliegenden Parameter eines Zustandsraummodells selbst (Kovarianzen von Rauschen und Übergangs- / Beobachtungsmatrizen) ändern. Wenn Ihre aktuelle Beobachtung von einer etwas anderen Quelle stammt als die anderen, können Sie sie problemlos in die Schätzung einbeziehen, ohne dies zu tun Irgendwas besonderes;
- Mithilfe der obigen Eigenschaften können Daten mit unregelmäßigen Abständen problemlos verarbeitet werden: Ändern Sie entweder jedes Mal ein Modell gemäß dem Intervall zwischen den Beobachtungen oder verwenden Sie ein reguläres Intervall und behandeln Sie Intervalle ohne Beobachtungen als fehlende Daten.
- Es ermöglicht die gleichzeitige Verwendung von Daten aus verschiedenen Quellen im selben Modell, um eine zugrunde liegende Größe zu schätzen.
- Es erlaubt, ein Modell aus mehreren interpretierbaren, nicht beobachtbaren dynamischen Komponenten zu konstruieren und diese zu schätzen.
- Jedes ARIMA-Modell kann in einer Zustandsraumform dargestellt werden, aber nur einfache Zustandsraummodelle können exakt in ARIMA-Form dargestellt werden.
time-series
arima
kalman-filter
var
Kochede
quelle
quelle
Antworten:
Hier ist eine vorläufige Liste der Nachteile, die ich Ihren Kommentaren entnehmen konnte. Kritik und Ergänzungen sind herzlich willkommen!
Insgesamt - im Vergleich zu ARIMA können Sie mit Zustandsraummodellen komplexere Prozesse modellieren, die Struktur interpretieren und Datenunregelmäßigkeiten leicht handhaben. Dafür zahlen Sie jedoch mit einer höheren Komplexität eines Modells, einer härteren Kalibrierung und weniger Community-Wissen.
quelle
Vielen Dank an @IrishStat für einige sehr gute Fragen in Kommentaren. Die Antwort auf Ihre Fragen ist zu lang, um als Kommentar gepostet zu werden. Deshalb poste ich sie als Antwort (leider nicht auf die ursprüngliche Frage des Themas).
Die Fragen lauteten: " Identifiziert es klar Zeittrendänderungen und meldet die Zeitpunkte, zu denen sich der Trend ändert? Unterscheidet es zwischen Parameteränderungen und Änderungen der Fehlervarianz und meldet dies? Erkennt und meldet es spezifische Vor- und Nachlaufeffekte um den Benutzer herum angegebene Prädiktoren? Kann man die minimale Anzahl der Werte in einer Gruppe vor einer Pegelverschiebung / Ortszeit Trend angeben erklärt wird ? ist es zwischen der Notwendigkeit unterscheidet für Leistung in Abhängigkeit von deterministischen Zeitpunkt transformiert , wo die Fehlervarianz ändert? "
quelle
Der Kalman-Filter ist der optimale lineare quadratische Schätzer, wenn die Zustandsdynamik und die Messfehler den sogenannten linearen Gaußschen Annahmen folgen ( http://wp.me/p491t5-PS ). Solange Sie Ihre Dynamik- und Messmodelle kennen und diese den linearen Gaußschen Annahmen folgen, gibt es keinen besseren Schätzer in der Klasse der linearen quadratischen Schätzer. Die häufigsten Gründe für "fehlgeschlagene" Kalman-Filter-Anwendungen sind jedoch:
Ungenaue / falsche Kenntnis der Zustandsdynamik und der Messmodelle.
Ungenaue Initialisierung des Filters (Bereitstellung einer anfänglichen Zustandsschätzung und Kovarianz, die nicht mit dem tatsächlichen Systemzustand übereinstimmt). Dies lässt sich mithilfe eines WLS-Initialisierungsverfahrens (Weighted Least Squares) leicht überwinden.
Einbeziehen von Messungen, die statistische "Ausreißer" in Bezug auf das Systemdynamikmodell sind. Dies kann dazu führen, dass die Kalman-Verstärkung negative Elemente aufweist, die nach der Aktualisierung zu einer nicht positiven semidefiniten Kovarianzmatrix führen können. Dies kann vermieden werden, indem "Gating" -Algorithmen, wie z. B. Ellipsoid-Gating, verwendet werden, um die Messung zu validieren, bevor der Kalman-Filter mit dieser Messung aktualisiert wird.
Dies sind einige der häufigsten Fehler / Probleme, die ich beim Arbeiten mit dem Kalman-Filter gesehen habe. Andernfalls ist der Kalman-Filter ein optimaler Schätzer, wenn die Annahmen Ihrer Modelle gültig sind.
quelle
Sie können sich auf das ausgezeichnete Buch Bayesian Forecasting and Dynamic Models (Harrison und West, 1997) beziehen . Die Autoren zeigen, dass fast alle traditionellen Zeitreihenmodelle Sonderfälle des allgemeinen dynamischen Modells sind. Sie betonen auch die Vorteile. Möglicherweise ist einer der Hauptvorteile die Einfachheit, mit der Sie viele Zustandsraummodelle integrieren können, indem Sie einfach den Zustandsvektor erweitern. Sie können beispielsweise Regressoren, saisonale Faktoren und eine autoregressive Komponente nahtlos in ein einziges Modell integrieren.
quelle
Ich würde hinzufügen, dass Sie, wenn Sie direkt eine State Space-Funktion verwenden, wahrscheinlich die verschiedenen Matrizen, aus denen ein Modell besteht, sowie deren Interaktion und Funktionsweise verstehen müssen. Es ist viel mehr wie das Definieren eines Programms als das Definieren eines ARIMA-Modells. Wenn Sie mit einem dynamischen State Space-Modell arbeiten, wird es noch komplizierter.
Wenn Sie ein Softwarepaket mit einer wirklich, wirklich netten State Space-Funktion verwenden, können Sie möglicherweise einige davon vermeiden, aber die überwiegende Mehrheit solcher Funktionen in R-Paketen erfordert, dass Sie irgendwann in die Details springen.
Meiner Meinung nach ähnelt es der Bayes'schen Statistik im Allgemeinen, deren Anwendung mehr Verständnis, Pflege und Fütterung erfordert als häufigere Funktionen.
In beiden Fällen ist es die zusätzlichen Details / Kenntnisse wert, aber es könnte ein Hindernis für die Annahme sein.
quelle