Verwirrung in Bezug auf lineare dynamische Systeme

9

Ich habe dieses Buch Mustererkennung und maschinelles Lernen von Bishop gelesen. Ich hatte eine Verwirrung in Bezug auf eine Ableitung des linearen dynamischen Systems. In LDS nehmen wir an, dass die latenten Variablen kontinuierlich sind. Wenn Z die latenten Variablen und X die beobachteten Variablen bezeichnet

p(zn|zn1)=N(zn|Azn1,τ)

p(xn|zn)=N(xn,Czn,Σ)

p(z1)=N(z1|u0,V0)

In LDS wird auch die Weiterleitung von Alpha-Beta-Vorwärts-Rückwärts-Nachrichten verwendet, um die hintere latente Verteilung zu berechnen, dhp(zn|X)

α(zn)=p(x1...xn,zn)

α^(zn)=α(zn)/P(x1....xn)

Meine erste Frage ist in dem Buch, als das es gegeben wird

α^(zn)=N(zn|un,Vn)

Wie kommt es, dass wir das oben genannte haben? Ich meine = . Ich meine, wie haben wir das bekommen?α^(zn)N(zn|un,Vn))

Meine nächste Frage bezieht sich auf die Ableitung, da Sie den Screenshots der Seiten des beigefügten Buches folgen können. Ich habe nicht verstanden, woher und was der Kalman-Filtergewinn istKn

un=Aun1+Kn(xnCAun1)

Vn=IKnC)P(n1)

cn=N(xn|CAun1,CPn1CT+Σ

Kn ist die Kalman-VerstärkungsmatrixPn1CT(CPn1CT+Σ)1

Wie haben wir die obigen Gleichungen abgeleitet? Ich meine, wie kommt es?

un=Aun1+Kn(xnCAun1)

Ich bin nur verwirrt, wie die obige Ableitung gemacht wird. Geben Sie hier die Bildbeschreibung ein

Geben Sie hier die Bildbeschreibung ein

Geben Sie hier die Bildbeschreibung ein

user34790
quelle

Antworten:

1

Es gibt eine nette Ableitung, mehrere davon im Folgenden: http://amzn.com/0470173661

Dies ist auch ein gutes Buch zu diesem Thema: http://amzn.com/0471708585

Die vollständige Ableitung und Vereinfachungen, die zu der von Ihnen vorgelegten verkürzten Form des Lehrbuchs führen, sind nicht kurz / sauber, so dass sie häufig weggelassen oder dem Leser als Übung überlassen werden.

Sie können sich den Kalman-Gewinn als einen Mischungsanteil vorstellen, der eine gewichtete Summe aus einem analytischen / symbolischen Modell und einer verrauschten Messung in der realen Welt ergibt. Wenn Sie beschissene Messungen haben, aber ein gutes Modell, sollte eine richtig eingestellte Kalman-Verstärkung das Modell begünstigen. Wenn Sie ein Junk-Modell haben, aber ziemlich gute Messungen, sollte Ihr Kalman-Gewinn die Messungen begünstigen. Wenn Sie Ihre Unsicherheiten nicht genau im Griff haben, kann es schwierig sein, Ihren Kalman-Filter richtig einzurichten.

Wenn Sie die Eingaben richtig einstellen, ist dies ein optimaler Schätzer. Es gibt eine Reihe von Annahmen, die in die Ableitung einfließen, und wenn eine davon nicht zutrifft, wird sie zu einem ziemlich guten suboptimalen Schätzer. Ein Lag-Diagramm zeigt beispielsweise, dass die im Kalman-Filter implizierte einstufige Markov-Annahme für eine Kosinusfunktion nicht zutrifft. Eine Taylor-Reihe ist eine Annäherung, aber nicht genau. Sie können einen erweiterten Kalman-Filter basierend auf der Taylor-Serie erstellen, dieser ist jedoch ungefähr und nicht genau. Wenn Sie Informationen aus zwei vorherigen Zuständen anstelle von einem aufnehmen können, können Sie einen Block-Kalman-Filter verwenden und Ihre Optimalität wiedererlangen. Unterm Strich ist es kein schlechtes Werkzeug, aber es ist nicht "die Silberkugel" und Ihre Laufleistung wird variieren. Stellen Sie sicher, dass Sie es gut charakterisieren, bevor Sie es in der realen Welt verwenden.

EngrStudent
quelle