Wie kann man das r-Quadrat zwischen Prädiktorvariablen in multipler Regression aufteilen?

16

Ich habe gerade einen Artikel gelesen, in dem die Autoren eine multiple Regression mit zwei Prädiktoren durchgeführt haben. Der gesamte r-Quadrat-Wert betrug 0,65. Sie stellten eine Tabelle zur Verfügung, die das Quadrat zwischen den beiden Prädiktoren aufteilte. Die Tabelle sah so aus:

            rsquared beta    df pvalue
whole model     0.65   NA  2, 9  0.008
predictor 1     0.38 1.01 1, 10  0.002
predictor 2     0.27 0.65 1, 10  0.030

In diesem Modell, in dem Rder mtcarsDatensatz verwendet wurde, beträgt der r-Quadrat-Gesamtwert 0,76.

summary(lm(mpg ~ drat + wt, mtcars))

Call:
lm(formula = mpg ~ drat + wt, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.4159 -2.0452  0.0136  1.7704  6.7466 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   30.290      7.318   4.139 0.000274 ***
drat           1.442      1.459   0.989 0.330854    
wt            -4.783      0.797  -6.001 1.59e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 3.047 on 29 degrees of freedom
Multiple R-squared:  0.7609,    Adjusted R-squared:  0.7444 
F-statistic: 46.14 on 2 and 29 DF,  p-value: 9.761e-10

Wie kann ich den r-Quadrat-Wert auf die beiden Prädiktorvariablen aufteilen?

Luciano
quelle
1
Dieser Beitrag enthält Informationen zum Partitionieren des . R2
COOLSerdash
8
Dieser Kommentar kann kurz und unangemessen den Standpunkt vertreten, dass sich dies oft als zwecklos oder gar nicht gefährlich erweisen wird. Der Erfolg oder Misserfolg eines Modells wird am besten als Ergebnis der Teamarbeit der Prädiktoren (und ihrer jeweiligen Funktionsformen, Interaktionsterme usw. usw.) angesehen und ist als solche zu beurteilen. Natürlich sind die meisten von uns an der relativen Bedeutung von Prädiktoren interessiert und es ist kein Unsinn, aber Versuche, sie genau zu quantifizieren, müssen mit vollständigen Aussagen über die technischen und philosophischen Grenzen einer solchen Übung einhergehen.
Nick Cox

Antworten:

5

Sie können einfach die zwei separaten Korrelationen abrufen und sie quadrieren oder zwei separate Modelle ausführen und das R ^ 2 erhalten. Sie werden nur zusammengefasst, wenn die Prädiktoren orthogonal sind.

John
quelle
2
Meinen Sie mit "orthogonal", dass die beiden Prädiktoren nicht miteinander korreliert sein sollten?
Luciano
3
Ja, unkorreliert ... es ist die einzige Art, wie sie sich zur Summe addieren.
John
12

Zusätzlich zu Johns Antwort möchten Sie möglicherweise die quadrierten semi-partiellen Korrelationen für jeden Prädiktor erhalten.

  • Nichtkorrelierte Prädiktoren : Wenn die Prädiktoren orthogonal (dh nicht korreliert) sind, stimmen die quadrierten semi-partiellen Korrelationen mit den quadrierten Korrelationen nullter Ordnung überein.
  • Korrelierte Prädiktoren: Wenn die Prädiktoren korreliert sind, repräsentiert die quadrierte semi-partielle Korrelation die eindeutige Varianz, die durch einen gegebenen Prädiktor erklärt wird. In diesem Fall ist die Summe der quadrierten semi-partiellen Korrelationen kleiner als . Diese verbleibende erklärte Varianz repräsentiert die Varianz, die durch mehr als eine Variable erklärt wird.R2

Wenn Sie nach einer R-Funktion suchen, befindet sich diese spcor()im ppcorPaket.

Möglicherweise möchten Sie auch das umfassendere Thema der Bewertung der Variablenwichtigkeit bei multipler Regression berücksichtigen (siehe z. B. diese Seite zum relaimpo-Paket ).

Jeromy Anglim
quelle
3

Ich habe das Tag zu Ihrer Frage hinzugefügt . Hier ist ein Teil seines Tag-Wikis :

R2p!p

Grömping (2007, The American Statistician ) gibt einen Überblick und Hinweise zur Literatur im Zusammenhang mit der Beurteilung der variablen Bedeutung.

S. Kolassa - Setzen Sie Monica wieder ein
quelle
y ~ a + by ~ b + ay ~ ay ~ a + by ~ by ~ a + by ~ b + a2p
R2aabR2y~1y~abR2y~by~a+b
2p2!
2p=q=0p(pq)(pq)qpq=0qqq=1pq(pq)2p