Wir haben einen multivariaten normalen Vektor . Partitionieren Sie und in
mit einer ähnlichen Partition von in Dann , die bedingte Verteilung der ersten Partition bei der zweiten, ist mit mittlerer und Kovarianzmatrix
Eigentlich werden diese Ergebnisse auch in Wikipedia bereitgestellt, aber ich habe keine Ahnung, wie die und abgeleitet werden. Diese Ergebnisse sind von entscheidender Bedeutung, da sie eine wichtige statistische Formel für die Ableitung von Kalman-Filtern darstellen . Würde mir jemand Ableitungsschritte zum Ableiten von und ? Vielen Dank!
normal-distribution
conditional-probability
Fliegende Schweine
quelle
quelle
Antworten:
Sie können dies beweisen, indem Sie die bedingte Dichte explizit mit roher Gewalt berechnen, wie in Procrastinators Link (+1) in den Kommentaren. Es gibt jedoch auch einen Satz, der besagt, dass alle bedingten Verteilungen einer multivariaten Normalverteilung normal sind. Daher müssen Sie nur den Mittelwert aus Vektor und Kovarianzmatrix berechnen. Ich erinnere mich, dass wir dies in einer Zeitreihenklasse im College durch geschickte Definition einer dritten Variablen und Verwendung ihrer Eigenschaften abgeleitet haben, um das Ergebnis einfacher als die Brute-Force-Lösung im Link abzuleiten (sofern Sie mit Matrixalgebra vertraut sind). Ich werde aus der Erinnerung, aber es war so etwas:
Sei die erste Partition und die zweite. Definieren Sie nun wobei . Jetzt können wir schreibenx1 x2 z=x1+Ax2 A=−Σ12Σ−122
Daher sind und nicht korreliert und, da sie gemeinsam normal sind, unabhängig . Nun ist klar , daher folgt darausz x2 E(z)=μ1+Aμ2
was den ersten Teil beweist. Beachten Sie für die Kovarianzmatrix Folgendes
Jetzt sind wir fast fertig:
was den zweiten Teil beweist.
Hinweis: Für diejenigen, die mit der hier verwendeten Matrixalgebra nicht sehr vertraut sind, ist dies eine hervorragende Ressource .
Bearbeiten: Eine Eigenschaft, die hier verwendet wird, befindet sich nicht im Matrixkochbuch (good catch @FlyingPig). Eigenschaft 6 auf der Wikipedia-Seite über Kovarianzmatrizen: Dies ist die für zwei Zufallsvektoren , Für Skalare gilt natürlich aber für Vektoren sind sie unterschiedlich, sofern die Matrizen unterschiedlich angeordnet sind.x,y
quelle
Die Antwort von Macro ist großartig, aber hier ist eine noch einfachere Möglichkeit, bei der Sie keinen externen Satz verwenden müssen, der die bedingte Verteilung behauptet. Es geht darum, den Mahanalobis-Abstand in einer Form zu schreiben, die die Argumentvariable für die Konditionierungsanweisung trennt, und dann die normale Dichte entsprechend zu faktorisieren.
Umschreiben der Mahanalobis-Distanz für einen bedingten Vektor: Diese Herleitung verwendet eine Matrixinversionsformel, die das Schur-Komplement . Wir verwenden zuerst die blockweise Inversionsformel , um die inverse Varianzmatrix wie folgt zu schreiben:ΣS=Σ11−Σ12Σ−122Σ21
wo:
Mit dieser Formel können wir nun die Mahanalobis-Distanz wie folgt schreiben:
wo:
Beachten Sie, dass dieses Ergebnis ein allgemeines Ergebnis ist, das keine Normalität der Zufallsvektoren voraussetzt. Es gibt eine nützliche Möglichkeit, den Mahanalobis-Abstand so umzuformen, dass er eine quadratische Form in Bezug auf nur einen der Vektoren in der Zerlegung ist (wobei der andere in der mittleren Vektor- und Varianzmatrix absorbiert ist).
Ableiten der bedingten Verteilung: Nachdem wir nun die obige Form für die Mahanalobis-Distanz haben, ist der Rest einfach. Wir haben:
Dies stellt fest, dass die bedingte Verteilung auch eine multivariate Normalverteilung mit dem angegebenen bedingten Mittelwertvektor und der angegebenen bedingten Varianzmatrix ist.
quelle