Erstens schätze ich, dass Diskussionen über Allgemeinen Erklärungen zu (dh dem Bestimmungskoeffizienten in der Regression) hervorrufen . Das Problem, das ich beantworten möchte, besteht darin, dies auf alle Fälle der Korrelation zwischen zwei Variablen zu verallgemeinern.R 2
Ich bin also schon eine ganze Weile verwirrt über die gemeinsame Varianz. Ich habe einige Erklärungen erhalten, aber alle scheinen problematisch zu sein:
Es ist nur ein anderer Begriff für Kovarianz. Dies kann nicht der Fall sein, wie Faktorenanalyse Literatur unterscheidet zwischen PCA und EFA mit der Feststellung , dass die letztgenannten Konten für gemeinsame Varianz und die ehemaligen nicht (PCA offensichtlich ist für Kovarianz Bilanzierung, dass es eine Kovarianzmatrix Betrieb über, so geteilt Varianz muss ein eigenständiges Konzept sein).
Es ist der quadratische Korrelationskoeffizient ( ). Sehen:
Das macht etwas mehr Sinn. Das Problem hierbei ist die Interpretation, wie dies impliziert, dass es sich um eine gemeinsame Varianz handelt. Zum Beispiel ist eine Interpretation von 'Sharing Varianz' . reduziert sich nicht darauf oder auf ein leicht intuitives Konzept [ ;; Das ist ein 4-dimensionales Objekt.r 2 c o v ( A , B ) 2 / ( v a r ( A ) × v a r ( B ) )
Die obigen Links versuchen beide, es anhand eines Ballentine-Diagramms zu erklären. Sie helfen nicht. Erstens sind die Kreise gleich groß (was aus irgendeinem Grund für die Abbildung wichtig zu sein scheint), was ungleiche Abweichungen nicht berücksichtigt. Man könnte annehmen, dass es sich um die Ballentine-Diagramme für die standardisierten Variablen handelt, also um die gleiche Varianz. In diesem Fall würde das überlappende Segment die Kovarianz zwischen zwei standardisierten Variablen (die Korrelation) erklären. Also , nicht .r 2
TL; DR: Erklärungen zur gemeinsamen Varianz sagen dies:
Durch Quadrieren des Koeffizienten wissen Sie, wie viel Varianz die beiden Variablen prozentual gemeinsam haben.
Warum sollte das so sein?
quelle
Antworten:
Man kann nur raten, was ein bestimmter Autor unter "gemeinsamer Varianz" verstehen könnte. Wir könnten hoffen, die Möglichkeiten zu umschreiben, indem wir überlegen, welche Eigenschaften dieses Konzept (intuitiv) haben sollte. Wir wissen, dass "Varianzen addieren": Die Varianz einer Summe ist die Summe der Varianzen von und wenn und keine Kovarianz haben. Es ist natürlich, die "gemeinsame Varianz" von zu definieren, wobei die Summe der Bruchteil der Varianz der Summe ist, die durch die Varianz von . Dies reicht aus, um die gemeinsamen Varianzen von zwei beliebigen Zufallsvariablen zu implizieren X ε X ε X X X Y.X.+ ε X. ε X ε X X X und muss das Quadrat ihres Korrelationskoeffizienten sein.Y
Dieses Ergebnis gibt der Interpretation eines quadratischen Korrelationskoeffizienten als "gemeinsame Varianz" eine Bedeutung: In einem geeigneten Sinne ist es tatsächlich ein Bruchteil einer Gesamtvarianz, die einer Variablen in der Summe zugeordnet werden kann.
Die Details folgen.
Prinzipien und ihre Auswirkungen
Wenn , sollte ihre "gemeinsame Varianz" (von nun an "SV") 100% betragen. Aber was ist, wenn und nur skalierte oder verschobene Versionen voneinander sind? Was ist zum Beispiel, wenn die Temperatur einer Stadt in Grad F und die Temperatur in Grad C darstellt? Ich möchte vorschlagen, dass in solchen Fällen und immer noch 100% SV haben sollten, damit dieses Konzept unabhängig davon, wie und gemessen werden könnten, aussagekräftig bleibt :Y X Y X X Y X Y.Y=X Y X Y X X Y X Y
für beliebige Zahlen und Zahlen ungleich Null .β , δα,γ β,δ
Ein anderes Prinzip könnte sein, dass wenn eine von unabhängige Zufallsvariable ist , die Varianz von eindeutig in zwei nicht negative Teile zerlegt werden kann.X X + εε X X+ε
Wir schlagen vor, SV in diesem speziellen Fall als zu definieren
Da alle diese Kriterien nur bis zur zweiten Ordnung sind - sie werden nur die ersten und zweiten Momente der Variablen in den Formen der Erwartungen beinhalten und Varianzen - lassen Sie uns entspannen die Forderung , dass und sein unabhängig und nur verlangen , dass sie sein unkorreliert . Dadurch wird die Analyse viel allgemeiner als sonst.εX ε
Die Ergebnisse
Diese Prinzipien führen - wenn Sie sie akzeptieren - zu einem einzigartigen, vertrauten und interpretierbaren Konzept. Der Trick wird darin bestehen, den allgemeinen Fall auf den Sonderfall einer Summe zu reduzieren, in der wir die Definition anwenden können .(2)
Wenn , versuchen wir einfach, in eine skalierte, verschobene Version von plus eine Variable zu zerlegen , die nicht mit korreliert ist. Das heißt, wir finden (wenn es möglich ist) die Konstanten und und eine Zufallsvariable für welcheY X X α β ϵ(X,Y) Y X X α β ϵ
mit . Damit die Zersetzung eine Chance hat, einzigartig zu sein, sollten wir dies fordernCov(X,ε)=0
Sobald gefunden ist, wird durch bestimmtβ α
Dies sieht sehr nach linearer Regression aus und ist es auch. Das erste Prinzip besagt, dass wir und skalieren können, um eine Einheitsvarianz zu erhalten (vorausgesetzt, sie haben jeweils eine Varianz ungleich Null), und dass Standardregressionsergebnisse den Wert von in als Korrelation von und :X Y β (3) X Y
Darüber hinaus ergibt sich aus den Varianzen von(1)
impliziert
Folglich
Beachten Sie, dass die "gemeinsame Varianz" selbst symmetrisch ist , da der Regressionskoeffizient für (wenn auf Einheitsvarianz standardisiert) ist, was eine Terminologie rechtfertigt, die die Reihenfolge von vorschlägt und spielt keine Rolle:Y ρ(Y,X)=ρ(X,Y) X Y
quelle