Was ist der Unterschied zwischen multiplem R und R im Quadrat?

13

Bei der linearen Regression erhalten wir oft ein Vielfaches von R und R im Quadrat. Was sind die Unterschiede zwischen ihnen?

RockTheStar
quelle

Antworten:

15

R2r2R2RR2=r2RR2

RRR2

Nick Stauner
quelle
5
Wenn also in einer multiplen Regression R ^ 2 .76 ist, können wir sagen, dass das Modell 76% der Varianz in der abhängigen Variablen erklärt, während wir, wenn r ^ 2 .86 ist, sagen können, dass das Modell 86% der Varianz erklärt Varianz in der abhängigen Variablen? Was ist der Unterschied in ihrer Interpretation?
Wizlog
Wie die Antwort vermuten lässt - "multiple R" impliziert multiple Regressoren. Ist es möglich, mehrere R-Werte in einem einzelnen Regressormodell zu haben?
Abrar
2

Tatsächlich kann Mehrfaches R als Korrelation zwischen Antwort und angepassten Werten angesehen werden. Als solches ist es immer positiv. Mehrfaches R-Quadrat ist die quadratische Version.

Lassen Sie mich anhand eines kleinen Beispiels veranschaulichen:

set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)

fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared:  0.2347

(R <- cor(y, fitted(fit))) # 0.4845068
R^2                        # 0.2347469

Es ist nicht nötig, viel Aufhebens um "mehrere" zu machen oder nicht. Diese Formel gilt immer, auch in einer Anova-Einstellung. In dem Fall, in dem es nur eine Kovariable gibtX, dann ist R mit dem Vorzeichen der Steigung gleich der Korrelation zwischen X und die Antwort.

Michael M
quelle
0

Ich erkläre meinen Schülern einfach:

  1. Das Vielfache R ist als absoluter Wert des Korrelationskoeffizienten (oder des Korrelationskoeffizienten ohne negatives Vorzeichen) zu betrachten!

  2. Das R-Quadrat ist einfach das Quadrat des Vielfachen R. Es kann als Prozentsatz der durch die unabhängige (n) Variable (n) verursachten Variation durchlaufen werden.

Es ist leicht, das Konzept und den Unterschied auf diese Weise zu erfassen.

Senith
quelle