Wenn ich eine multivariate Normal IId Probe habe , und zu definieren d 2 i ( b , A ) = ( X i - b ) ' A - 1 ( X i - b ) (das ist eine Art Mahalanobis-Abstand [im Quadrat] von einem Abtastpunkt zum Vektor a unter Verwendung der Matrix A zur Gewichtung),
Ich betrachte eine Arbeit, die behauptet, sie sei , aber dies ist offensichtlich falsch: Die ≤ 2 p- Verteilung wäre für d 2 i ( μ , ≤ ) unter Verwendung des (unbekannten) Populationsmittelwertvektors und der Kovarianzmatrix erhalten worden. Wenn die Beispielanaloga eingesteckt sind, sollte man eine Hotelling T 2 -Verteilung oder eine skalierte F ( ⋅ ) -Verteilung oder so etwas erhalten, aber nicht die χ 2 p . Ich konnte das genaue Ergebnis weder in Muirhead (2005) noch in findenAnderson (2003) , noch in Mardia, Kent und Bibby (1979, 2003) . Anscheinend haben sich diese Typen nicht um die Diagnose von Ausreißern gekümmert, da die multivariate Normalverteilung perfekt ist und jedes Mal, wenn multivariate Daten erfasst werden, leicht ermittelt werden kann: - /.
Die Dinge können komplizierter sein. Das Hotelling -Verteilungsergebnis basiert auf der Annahme der Unabhängigkeit zwischen dem Vektorteil und dem Matrixteil; eine solche Unabhängigkeit gilt für ˉ X und S , aber es gilt nicht mehr für X i und S .
Antworten:
Sehen Sie sich die Modellierung von Gaußschen Gemischen an, indem Sie die Mahalanobis-Distanz ausnutzen ( alternativer Link ). Siehe Seite 13, Zweite Spalte. Die Autoren gaben auch einige Beweise für die Ableitung der Verteilung. Die Distribution ist Beta-skaliert. Bitte lassen Sie mich wissen, wenn dies bei Ihnen nicht funktioniert. Ansonsten könnte ich morgen jeden Hinweis im SS-Wilks-Buch nachlesen.
quelle
Es gibt 3 relevante Distributionen. Wenn die wahren Populationsparameter verwendet werden, wird, wie erwähnt, die Verteilung mit chi-quadriert . Dies ist auch die asymptotische Verteilung mit geschätzten Parametern und großem Stichprobenumfang.df=p
Eine andere Antwort liefert die korrekte Verteilung für die häufigste Situation mit geschätzten Parametern, wenn die Beobachtung selbst Teil der Schätzmenge ist:
quelle