Metriken für Kovarianzmatrizen: Nachteile und Stärken

11

Was sind die "besten" Metriken für Kovarianzmatrizen und warum? Mir ist klar, dass Frobenius & c nicht geeignet sind und Winkelparametrisierungen auch ihre Probleme haben. Intuitiv möchte man vielleicht einen Kompromiss zwischen diesen beiden, aber ich würde auch gerne wissen, ob es andere Aspekte zu beachten gibt und vielleicht gut etablierte Standards.

Gängige Metriken haben verschiedene Nachteile, da sie für Kovarianzmatrizen nicht natürlich sind, z. B. bestrafen sie Nicht-PSD-Matrizen häufig nicht besonders oder verhalten sich im Rang nicht gut (betrachten Sie zwei gedrehte Kovarianzellipsoide mit niedrigem Rang: Ich möchte dasselbe -Rang Zwischendrehung, um geringere Abstände als den komponentenweisen Durchschnitt zu haben, was bei und vielleicht bei Frobenius nicht der Fall ist , bitte korrigieren Sie mich hier). Auch die Konvexität ist nicht immer garantiert. Es wäre gut, diese und andere Probleme zu sehen, die durch eine "gute" Metrik angegangen werden.L1

Hier finden Sie eine gute Diskussion einiger Probleme, ein Beispiel aus der Netzwerkoptimierung und eines aus der Bildverarbeitung . Und hier ist eine ähnliche Frage , die einige andere Metriken enthält, jedoch ohne Diskussion.

Quarz
quelle
2
Was ist der Zweck der von Ihnen gesuchten Metrik? Wofür ist die Frobenius-Metrik ungeeignet?
whuber
1
L1
Wie ist diese letzte Frage, die Sie als "eingeschränkter" bezeichnen? Schließlich sind alle Kovarianzmatrizen symmetrisch. Es scheint ein perfektes Duplikat zu sein.
whuber
1
Das ist eine gute Kritik an der anderen Frage. Darf ich vorschlagen, dass Sie Ihre Frage (und Ihren Titel) bearbeiten, um den Inhalt Ihres letzten Kommentars wiederzugeben? Dies unterscheidet es deutlich von dem offensichtlichen Duplikat und hilft den Befragten, angemessenere Antworten zu geben. (Und machen Sie sich keine Sorgen über Änderungen an Ihrer eigenen Frage: Das wird erwartet; im Meta-Thread geht es hauptsächlich um Community- Bearbeitung.)
whuber
1
@kjetilbhalvorsen Das ist ein provokanter Satz! Könnten Sie eine Antwort erweitern? Oder eine Artikelreferenz angeben?
Sycorax sagt Reinstate Monica

Antworten:

2

Ich glaube nicht, dass es eine gute Metrik oder den besten Weg gibt, Kovarianzmatrizen zu analysieren. Die Analyse sollte immer auf Ihr Ziel ausgerichtet sein. Angenommen, C ist meine Kovarianzmatrix. Die Diagonale enthält die Varianz für jeden berechneten Parameter. Wenn Sie also an der Parametersignifikanz interessiert sind, ist Trace (C) ein guter Anfang, da es Ihre Gesamtleistung ist.

Wenn Sie Ihren Parameter und seine Bedeutung darstellen, sehen Sie ungefähr Folgendes:

x1 =  1.0 ±  0.1 
x2 = 10.0 ±  5.0
x3 =  5.0 ± 15.0 <-- non-significant parameter

Wenn Sie an ihrer gegenseitigen Korrelation interessiert sind, könnte eine solche Tabelle etwas Interessantes ergeben:

x1  1.0
x2  0.9  1.0
x3 -0.3 -0.1  1.0
    x1    x2   x3

Jedes Element ist der Korrelationskoeffizient zwischen den Parametern xi und xj. Aus dem Beispiel ist ersichtlich, dass die Parameter x1 und x2 stark korreliert sind.

nali
quelle
1

Interessante Frage, ich beschäftige mich im Moment mit dem gleichen Thema! Es hängt davon ab, wie Sie "am besten" definieren, dh ob Sie nach einem durchschnittlichen Einzelwert für den Spread oder nach der Korrelation zwischen den Daten usw. suchen. Ich fand in Press, SJ (1972): Applied Multivariate Analysis, p. 108 dass die verallgemeinerte Varianz, definiert als Determinante der Kovarianzmatrix, als einzelnes Maß für die Ausbreitung nützlich ist. Aber wenn es eine Korrelation ist, nach der Sie suchen, muss ich weiter nachdenken. Gib mir Bescheid.

Lucozade
quelle
3
Referenz bitte.
Nick Cox