Mehrdeutige Definition des Kalman-Filters im Fehlerzustand (indirekt)

11

Ich bin verwirrt darüber, was genau der Begriff "indirekter Kalman-Filter" oder "Fehlerzustands-Kalman-Filter" bedeutet.

Die plausibelste Definition, die ich gefunden habe, ist in Maybecks Buch [1]:

Wie der Name schon sagt, gehören in der (direkten) Formulierung des Gesamtzustandsraums Gesamtzustände wie Fahrzeugposition und Geschwindigkeit zu den Zustandsvariablen im Filter, und die Messungen sind INS-Beschleunigungsmesserausgänge und externe Quellensignale. In der (indirekten) Fehlerzustandsraumformulierung gehören die Fehler in der INS-angegebenen Position und Geschwindigkeit zu den geschätzten Variablen, und jede dem Filter präsentierte Messung ist die Differenz zwischen INS- und externen Quellendaten.

20 Jahre später haben Roumeliotis et al. in [2] schreibe:

Die umständliche Modellierung des spezifischen Fahrzeugs und seine Interaktion mit einer dynamischen Umgebung wird vermieden, indem stattdessen die Kreiselmodellierung ausgewählt wird. Das Kreiselsignal erscheint in den Systemgleichungen (anstelle der Messgleichungen), und daher erfordert die Formulierung des Problems einen indirekten Kalman-Filteransatz (Fehlerzustand).

Ich kann den kühnen Teil nicht verstehen, da Lefferts et al. in [3] viel früher schreiben:

Für autonome Raumfahrzeuge ermöglicht die Verwendung von Trägheitsreferenzeinheiten als Modellersatz die Umgehung dieser Probleme.

Und dann zeigen Sie verschiedene Varianten von EKFs mithilfe der Kreiselmodellierung, die eindeutig direkte Kalman-Filter gemäß Maybecks Definition sind: Der Zustand besteht nur aus der Einstellungsquaternion und der Kreiselvorspannung, nicht aus Fehlerzuständen. Tatsächlich gibt es kein separates INS, dessen Fehler mit einem Fehlerzustands-Kalman-Filter geschätzt werden kann.

Meine Fragen sind also:

  • Gibt es eine andere, möglicherweise neuere Definition von indirekten (Fehlerzustands-) Kalman-Filtern, die mir nicht bekannt sind?

  • Wie hängen Gyro-Modellierung im Gegensatz zur Verwendung eines geeigneten dynamischen Modells einerseits und die Entscheidung, ob ein direkter oder indirekter Kalman-Filter verwendet wird, andererseits zusammen? Ich hatte den Eindruck, dass beide unabhängige Entscheidungen sind.

[1] Maybeck, Peter S. Stochastische Modelle, Schätzung und Kontrolle. Vol. 1. Akademische Presse, 1979.

[2] Roumeliotis, Stergios I., Gaurav S. Sukhatme und George A. Bekey. "Umgehung der dynamischen Modellierung: Bewertung des Fehlerzustands-Kalman-Filters für die Lokalisierung mobiler Roboter." Robotics and Automation, 1999. Verfahren. 1999 IEEE International Conference on. Vol. 2. IEEE, 1999.

[3] Lefferts, Ern J., F. Landis Markley und Malcolm D. Shuster. "Kalman-Filterung zur Abschätzung der Fluglage von Raumfahrzeugen." Journal of Guidance, Control and Dynamics 5.5 (1982): 417-429.

sebsch
quelle

Antworten:

6

Hallo und willkommen in der weiten, mehrdeutigen, manchmal verwirrenden Welt der Forschung. Aber im Ernst, wenn man sich 20 Jahre Papiere ansieht, entstehen manchmal diese Verwirrungen. Schauen wir uns an, was los ist. In der ersten Referenz sagen sie:

Ein INS / Gyro ist nett, hat aber einen Fehler. Dieser Fehler ändert sich (driftet) im Laufe der Zeit. Daher ist der Fehler im INS wirklich ein Teil des Systemzustands.

Die im Kalman-Filter verwendete Markov-Annahme geht davon aus, dass der aktuelle Estiamte den gesamten Zustand des Systems und alle vorherigen Zustände des Systems einschließt . Der Aktualisierungsschritt des EKF / FK setzt voraus, dass die Sensoren den Zustand des Systems direkt und ohne Vorspannung messen . Ein INS hat jedoch eine Vorspannung (den Fehler), und diese Vorspannung ändert sich. Unser messbarer Zustand (die Messung vom INS / Gyro) ist also

z(t)=x(t)+b(t)+n

bnbn b(t)zb(t)

Ein Fehlerzustands-Kalman-Filter erzeugt einen neuen Zustandsvektor.

[x(t)b(t)]]=[x(t)b(t)]]+n
wo wieder x ist der wahre Zustand und b ist die wahre Tendenz.

Ok, weiter zu Referenz zwei, sie scheinen zu sagen, dass das Kreiselsignal (das Messungen der Form hat z(t)=x+b(t)+nwieder) wird verwendet, anstatt anzunehmen, dass der Kreisel den Zustand direkt misst. Das passt zu dem, was ich über die Forschung von Prof. Roumeliotis weiß, sowie zur Definition des Fehlerzustands KF und Lit. 1.

Jetzt ist Ref. 3 etwas schlecht formuliert. Ich konnte kein PDF erwerben, um es schnell zu überprüfen. Ich denke, dies bedeutet, dass sie die allgemeine Annahme verwenden, dass ein gutes Modell der Systemdynamik für einen Vorhersage- (oder Ausbreitungs-) Schritt nicht verfügbar ist . Stattdessen gehen sie davon aus, dass die INS-Messungen eine anständige Schätzung des Systemzustands darstellen, und verwenden dann andere Sensoren, um die Schätzung des Zustands zu aktualisieren.

Dies ist vergleichbar mit der Verwendung von Kilometerzählern, anstatt zu modellieren, wie Steuereingaben eine Zustandsänderung in einem Radroboter bewirken . Ja, die vorwärtsgerichtete Schätzung enthält die Vorspannung des INS, aber die Messungen sollten dies korrigieren. Tatsächlich besagt die Einleitung zu diesem Papier dasselbe, was wir hier zusammengefasst haben, dass die Verzerrung des Kreisels ein Teil des zu schätzenden Systems sein sollte.

Dies ist eine Art Zusammenfassung auf hoher Ebene, was das Beste ist, was ich an dieser Stelle tun kann. Wenn es spezielle Bedenken gibt, kann ich sie nach Bedarf bearbeiten.

Josh Vander Hook
quelle
Ich möchte nur verstehen, was hier los ist. Das Problem hierbei ist, dass das Rauschen vorgespannt ist, sodass eine der Anforderungen des Kalman-Filters nicht erfüllt ist und es nicht anwendbar ist, es direkt mit dem Kreisel zu verwenden. Deshalb brauchen sie einen anderen Weg, um herumzukommen. Ist das das Problem? Danke für die Antwort.
CroCo
Ja, ich werde die Antwort aktualisieren, um auch klarer zu sein.
Josh Vander Hook