Ich versuche zu verstehen, wie die Kovarianzmatrix funktioniert. Nehmen wir also an, wir haben zwei Variablen: , wobei Cov ( X , Y ) = E [ ( x - E [ X ] ) ( y - E [ Y ] ) ] die Beziehung zwischen den Variablen angibt, dh wie viel eine hängt vom anderen ab.
Nun, drei Variablen Fall ist es für mich weniger klar. Eine intuitive Definition für die Kovarianzfunktion wäre , aber stattdessen schlägt die Literatur vor Verwenden einer Kovarianzmatrix, die als zwei variable Kovarianz für jedes Variablenpaar definiert ist.
Enthält die Kovarianz also vollständige Informationen über variable Beziehungen? Wenn ja, in welcher Beziehung steht meine Definition von ?
correlation
covariance
moments
Karolis
quelle
quelle
Antworten:
Um Zacharys Kommentar zu erweitern, erfasst die Kovarianzmatrix nicht die "Beziehung" zwischen zwei Zufallsvariablen, da "Beziehung" ein zu weit gefasstes Konzept ist. Zum Beispiel möchten wir wahrscheinlich die Abhängigkeit zweier Variablen voneinander einbeziehen, um sie in ein beliebiges Maß ihrer "Beziehung" einzubeziehen. Wir wissen jedoch, dasscov(X,Y)=0 nicht bedeutet, dass sie unabhängig sind, wie dies beispielsweise bei zwei Zufallsvariablen X ~ U (-1,1) und Y = X ^ 2 (z Einen kurzen Beweis finden Sie unter: https://en.wikipedia.org/wiki/Covariance#Uncorrelatedness_and_independence ).
Wenn wir also glauben würden, dass die Kovarianz vollständige Informationen über variable Beziehungen enthält, würde eine Kovarianz von Null keine Abhängigkeit bedeuten. Dies ist, was Zachary meint, wenn er sagt, dass es nichtlineare Abhängigkeiten geben kann, die die Kovarianz nicht erfasst.
(Quelle: Prof. Geert Dhaene's Advanced Econometrics Folien)
quelle