Was sind die "besten" Metriken für Kovarianzmatrizen und warum? Mir ist klar, dass Frobenius & c nicht geeignet sind und Winkelparametrisierungen auch ihre Probleme haben. Intuitiv möchte man vielleicht einen Kompromiss zwischen diesen beiden, aber ich würde auch gerne wissen, ob es andere Aspekte zu beachten gibt und vielleicht gut etablierte Standards.
Gängige Metriken haben verschiedene Nachteile, da sie für Kovarianzmatrizen nicht natürlich sind, z. B. bestrafen sie Nicht-PSD-Matrizen häufig nicht besonders oder verhalten sich im Rang nicht gut (betrachten Sie zwei gedrehte Kovarianzellipsoide mit niedrigem Rang: Ich möchte dasselbe -Rang Zwischendrehung, um geringere Abstände als den komponentenweisen Durchschnitt zu haben, was bei und vielleicht bei Frobenius nicht der Fall ist , bitte korrigieren Sie mich hier). Auch die Konvexität ist nicht immer garantiert. Es wäre gut, diese und andere Probleme zu sehen, die durch eine "gute" Metrik angegangen werden.
Hier finden Sie eine gute Diskussion einiger Probleme, ein Beispiel aus der Netzwerkoptimierung und eines aus der Bildverarbeitung . Und hier ist eine ähnliche Frage , die einige andere Metriken enthält, jedoch ohne Diskussion.
quelle
Antworten:
Ich glaube nicht, dass es eine gute Metrik oder den besten Weg gibt, Kovarianzmatrizen zu analysieren. Die Analyse sollte immer auf Ihr Ziel ausgerichtet sein. Angenommen, C ist meine Kovarianzmatrix. Die Diagonale enthält die Varianz für jeden berechneten Parameter. Wenn Sie also an der Parametersignifikanz interessiert sind, ist Trace (C) ein guter Anfang, da es Ihre Gesamtleistung ist.
Wenn Sie Ihren Parameter und seine Bedeutung darstellen, sehen Sie ungefähr Folgendes:
Wenn Sie an ihrer gegenseitigen Korrelation interessiert sind, könnte eine solche Tabelle etwas Interessantes ergeben:
Jedes Element ist der Korrelationskoeffizient zwischen den Parametern xi und xj. Aus dem Beispiel ist ersichtlich, dass die Parameter x1 und x2 stark korreliert sind.
quelle
Interessante Frage, ich beschäftige mich im Moment mit dem gleichen Thema! Es hängt davon ab, wie Sie "am besten" definieren, dh ob Sie nach einem durchschnittlichen Einzelwert für den Spread oder nach der Korrelation zwischen den Daten usw. suchen. Ich fand in Press, SJ (1972): Applied Multivariate Analysis, p. 108 dass die verallgemeinerte Varianz, definiert als Determinante der Kovarianzmatrix, als einzelnes Maß für die Ausbreitung nützlich ist. Aber wenn es eine Korrelation ist, nach der Sie suchen, muss ich weiter nachdenken. Gib mir Bescheid.
quelle