Ich bin neugierig auf die Natur von . Kann jemand etwas intuitives über "Was sagt Σ - 1 über Daten?"
Bearbeiten:
Danke für die Antworten
Nach einigen großartigen Kursen möchte ich einige Punkte hinzufügen:
- Es ist ein Maß für Information, dh ist eine Informationsmenge entlang der Richtung x .
- Dualität: Da positiv definit ist, gilt auch für Σ - 1 , dass es sich um Skalarproduktnormen handelt, genauer gesagt um Doppelnormen, sodass wir Fenchel dual für das regulierte Problem der kleinsten Quadrate ableiten und die Maximierung für dual durchführen können Problem. Wir können eine von ihnen wählen, abhängig von ihrer Konditionierung.
- Hilbert-Raum: Spalten (und Reihen) von und Σ erstrecken sich über den gleichen Raum. Es gibt also keinen Vorteil (außer wenn eine dieser Matrizen schlecht konditioniert ist) zwischen der Darstellung mit Σ - 1 oder Σ
- Frequentistische Statistik: Sie ist eng mit Fisher-Informationen verbunden, die die Cramér-Rao-Bindung verwenden. Tatsächlich ist die Fisher-Informationsmatrix (äußeres Produkt des Gradienten der logarithmischen Wahrscheinlichkeit mit sich selbst) Cramér-Rao-gebunden, dh (bezüglich positiver semidefiniter Kegel, iewrt Konzentration) Ellipsoide). Wenn also der Maximum-Likelihood-Schätzer effizient, dh die Daten enthalten ein Maximum an Informationen, sodass ein häufig auftretendes Regime optimal ist. In einfacheren Worten, für einige Wahrscheinlichkeitsfunktionen (man beachte, dass die funktionale Form der Wahrscheinlichkeit nur von dem wahrscheinlichen Modell abhängt, das angeblich Daten generiert, auch bekannt als generatives Modell), ist die maximale Wahrscheinlichkeit ein effizienter und konsistenter Schätzer und regiert wie ein Boss. (Entschuldigung für das Übermaß)
Antworten:
Es ist ein Maß für die Präzision, genau wie ein Maß für die Streuung ist.Σ
Genauer gesagt ist ein Maß dafür, wie die Variablen um den Mittelwert (die diagonalen Elemente) verteilt sind und wie sie mit anderen Variablen (den nicht diagonalen Elementen) zusammen variieren. Je weiter die Streuung vom Mittelwert entfernt ist und je mehr sie sich (in absoluten Zahlen) mit den anderen Variablen decken, desto stärker ist die Tendenz, sich zusammen zu bewegen (in der gleichen oder entgegengesetzten Richtung, je nachdem, in welcher Richtung sie sich bewegen) Zeichen der Kovarianz).Σ
In ähnlicher Weise ist ein Maß dafür, wie eng die Variablen um den Mittelwert (die diagonalen Elemente) gruppiert sind und inwieweit sie nicht mit den anderen Variablen (den nicht diagonalen Elementen) übereinstimmen. Je höher das diagonale Element ist, desto dichter ist die Variable um den Mittelwert gruppiert. Die Interpretation der nicht diagonalen Elemente ist subtiler, und ich verweise auf die anderen Antworten für diese Interpretation.Σ−1
quelle
Verwendung von hochgestellten Indizes der Elemente der invers zu bezeichnen, ist die Varianz der Komponente der Variable , die mit den unkorrelierten sind anderen Variablen, und ist die partielle Korrelation der Variablen und , die die anderen Variablen steuert .1/σii i p−1 −σij/σiiσjj−−−−−√ i j p−2
quelle