Dies mag eine grundlegende Frage sein, aber ich habe mich gefragt, warum ein Wert in einem Regressionsmodell einfach quadriert werden kann, um eine Zahl der erklärten Varianz zu erhalten.
Ich verstehe, dass der Koeffizient die Stärke einer Beziehung angeben kann, aber ich verstehe nicht, wie einfach das Quadrieren dieses Werts ein Maß für die erklärte Varianz ergibt.
Irgendeine einfache Erklärung dafür?
Vielen Dank für Ihre Hilfe!
regression
correlation
r-squared
David
quelle
quelle
Antworten:
Hand-wavingly die Korrelation kann zwischen zwei Vektoren, die abhängige Vektor als Maß des Winkels betrachtet werden Y und der unabhängigen Vektor - X . Wenn der Winkel zwischen den Vektoren ist θ die Korrelation R ist cos ( θ ) . Der Teil von Y , der durch X erklärt wird, hat die Länge | | Y | | cos ( θ ) und ist parallel zu X (oder der Projektion von Y auf X ). Der nicht erläuterte Teil ist langR Y X θ R cos(θ) Y X ||Y||cos(θ) X Y X und ist orthogonal zu X. In Bezug auf Varianzen haben wir
||Y||sin(θ) X
wobei der erste Term rechts die erklärte Varianz und der zweite die unerklärte Varianz ist. Die Fraktiondie erläutert wirdist somit R 2 nicht R .
quelle