Warum geben lineare Regression und ANOVA unterschiedliche Werte an, wenn die Wechselwirkung zwischen Variablen berücksichtigt wird?


Ich habe versucht, Zeitreihendaten (ohne Replikate) mithilfe eines Regressionsmodells anzupassen. Die Daten sehen folgendermaßen aus:

> xx.2
          value time treat
    1  8.788269    1     0
    2  7.964719    6     0
    3  8.204051   12     0
    4  9.041368   24     0
    5  8.181555   48     0
    6  8.041419   96     0
    7  7.992336  144     0
    8  7.948658    1     1
    9  8.090211    6     1
    10 8.031459   12     1
    11 8.118308   24     1
    12 7.699051   48     1
    13 7.537120   96     1
    14 7.268570  144     1

Aufgrund fehlender Replikate behandle ich die Zeit als kontinuierliche Variable. Die Spalte "Treat" zeigt die Fall- bzw. Kontrolldaten.

Zuerst passe ich das Modell "value = time * treat" mit "lm" an R:


lm(formula = value ~ time * treat, data = xx.2)

     Min       1Q   Median       3Q      Max 
-0.50627 -0.12345  0.00296  0.04124  0.63785 

             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  8.493476   0.156345  54.325 1.08e-13 ***
time        -0.003748   0.002277  -1.646   0.1307    
treat       -0.411271   0.221106  -1.860   0.0925 .  
time:treat  -0.001938   0.003220  -0.602   0.5606    

Der Wert von Zeit und Vergnügen ist nicht signifikant.

Während ich mit anova gearbeitet habe, habe ich unterschiedliche Ergebnisse erzielt:

            Df Sum Sq Mean Sq F value Pr(>F)  
time         1 0.7726  0.7726   8.586 0.0150 *
treat        1 0.8852  0.8852   9.837 0.0106 *
time:treat   1 0.0326  0.0326   0.362 0.5606  
Residuals   10 0.8998  0.0900                 

Der Wert für Zeit und Genuss hat sich geändert.

Wenn ich recht habe, bedeutet lineare Regression, dass die Zeit und die Behandlung keinen signifikanten Einfluss auf den Wert haben, während ANOVA bedeutet, dass Zeit und Behandlung einen signifikanten Einfluss auf den Wert haben.

Könnte mir jemand erklären, warum diese beiden Methoden unterschiedlich sind und welche?

Vielleicht möchten Sie die verschiedenen Arten von Quadratsummen nachschlagen. Insbesondere glaube ich, dass die lineare Regression die Summe der Quadrate vom Typ III zurückgibt, während die Anova eine andere Art zurückgibt.
Wenn Sie die Ergebnisse von speichern lmund aovüberprüfen, ob sie identische Anpassungen ergeben, Vergleichen Sie z. B. ihre Residuen mit der residualsFunktion oder untersuchen Sie ihre Koeffizienten ( $coefficientsin beiden Fällen den Schlitz).



Die Fit für lm () und aov () sind identisch, aber die Berichterstattung ist unterschiedlich. Bei den t-Tests handelt es sich um die marginale Auswirkung der betreffenden Variablen, wenn alle anderen Variablen vorhanden sind. Die F-Tests sind sequentiell - also testen sie die Wichtigkeit der Zeit in Gegenwart von nichts als dem Abfangen, der Behandlung in Gegenwart von nichts als dem Abfangen und der Zeit und der Interaktion in Gegenwart von allem Obigen.

Angenommen, Sie interessieren sich für die Bedeutung von treat. Ich schlage vor, Sie passen zwei Modelle an, eines mit und eines ohne. Vergleichen Sie die beiden Modelle, indem Sie beide Modelle in anova () einfügen, und verwenden Sie diesen F-Test. Dies wird die Behandlung und die Interaktion gleichzeitig testen.

Folgendes berücksichtigen:

> xx.2 <- as.data.frame(matrix(c(8.788269, 1, 0,
+ 7.964719, 6, 0,
+ 8.204051, 12, 0,
+ 9.041368, 24, 0,
+ 8.181555, 48, 0,
+ 8.041419, 96, 0,
+ 7.992336, 144, 0,
+ 7.948658, 1, 1,
+ 8.090211, 6, 1,
+ 8.031459, 12, 1,
+ 8.118308, 24, 1,
+ 7.699051, 48, 1,
+ 7.537120, 96, 1,
+ 7.268570, 144, 1), byrow=T, ncol=3))
> names(xx.2) <- c("value", "time", "treat")
> mod1 <- lm(value~time*treat, data=xx.2)
> anova(mod1)
Analysis of Variance Table

Response: value
           Df  Sum Sq Mean Sq F value  Pr(>F)  
time        1 0.77259 0.77259  8.5858 0.01504 *
treat       1 0.88520 0.88520  9.8372 0.01057 *
time:treat  1 0.03260 0.03260  0.3623 0.56064  
Residuals  10 0.89985 0.08998                  
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 
> mod2 <- aov(value~time*treat, data=xx.2)
> anova(mod2)
Analysis of Variance Table

Response: value
           Df  Sum Sq Mean Sq F value  Pr(>F)  
time        1 0.77259 0.77259  8.5858 0.01504 *
treat       1 0.88520 0.88520  9.8372 0.01057 *
time:treat  1 0.03260 0.03260  0.3623 0.56064  
Residuals  10 0.89985 0.08998                  
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 
> summary(mod2)
            Df Sum Sq Mean Sq F value Pr(>F)  
time         1 0.7726  0.7726   8.586 0.0150 *
treat        1 0.8852  0.8852   9.837 0.0106 *
time:treat   1 0.0326  0.0326   0.362 0.5606  
Residuals   10 0.8998  0.0900                 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 
> summary(mod1)

lm(formula = value ~ time * treat, data = xx.2)

     Min       1Q   Median       3Q      Max 
-0.50627 -0.12345  0.00296  0.04124  0.63785 

             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  8.493476   0.156345  54.325 1.08e-13 ***
time        -0.003748   0.002277  -1.646   0.1307    
treat       -0.411271   0.221106  -1.860   0.0925 .  
time:treat  -0.001938   0.003220  -0.602   0.5606    
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Residual standard error: 0.3 on 10 degrees of freedom
Multiple R-squared: 0.6526,     Adjusted R-squared: 0.5484 
F-statistic: 6.262 on 3 and 10 DF,  p-value: 0.01154 
Vielen Dank für die gründliche Erklärung, es erinnert mich an die ANCOVA (Analyse der Kovarianz). Der erste Schritt von ANCOVA besteht darin, die Wechselwirkung zwischen kategorialem Faktor und Kovariate zu testen, um festzustellen, ob sie für beide Bedingungen die gleiche Steigung aufweisen. Es ist ziemlich ähnlich zu dem, was ich hier gemacht habe. In ANCOVA gibt es den gleichen p-Wert für die Interaktion im t-Test und im F-Test, da die Interaktion der letzte Term in ist aov.





Die obigen zwei Antworten sind großartig, aber ich dachte, ich würde ein bisschen mehr hinzufügen. Ein weiteres Nugget an Informationen kann hier gefunden werden .

Wenn Sie die lm()Ergebnisse mit dem Interaktionsbegriff melden , sagen Sie so etwas wie: "Treat 1 unterscheidet sich von Treat 0 (Beta! = 0, p = 0,0925), wenn die Zeit auf den Basiswert 1 gesetzt ist ". Während die anova()Ergebnisse ( wie bereits erwähnt ) andere Variablen ignorieren und sich nur mit Varianzunterschieden befassen.

Sie können dies beweisen, indem Sie Ihren Interaktionsbegriff entfernen und ein einfaches Modell mit nur zwei Haupteffekten ( m1 ) verwenden:

> m1 = lm(value~time+treat,data=dat)
> summary(m1)

lm(formula = value ~ time + treat, data = dat)

     Min       1Q   Median       3Q      Max 
-0.54627 -0.10533 -0.04574  0.11975  0.61528 

             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  8.539293   0.132545  64.426 1.56e-15 ***
time        -0.004717   0.001562  -3.019  0.01168 *  
treat       -0.502906   0.155626  -3.232  0.00799 ** 
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.2911 on 11 degrees of freedom
Multiple R-squared:   0.64, Adjusted R-squared:  0.5746 
F-statistic: 9.778 on 2 and 11 DF,  p-value: 0.003627

> anova(m1)
Analysis of Variance Table

Response: value
          Df  Sum Sq Mean Sq F value   Pr(>F)   
time       1 0.77259 0.77259  9.1142 0.011677 * 
treat      1 0.88520 0.88520 10.4426 0.007994 **
Residuals 11 0.93245 0.08477                    
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

In diesem Fall sehen wir, dass die angegebenen p-Werte gleich sind; das ist, weil im Fall dieses einfacheren Modells,

Diese Antwort sieht leider unvollendet aus. Noch +1 für den Link und um zu erwähnen, dass der Effekt auf unterschiedliche Codierungsschemata zurückzuführen ist.
Man sollte das auch hinzufügen summary(lm)und anova(lm)wird nicht immer das gleiche Ergebnis liefern, wenn es keinen Interaktionsterm gibt. Es kommt einfach so vor, dass in diesen Daten timeund treatorthogonal sind und daher die Quadratsummen vom Typ I (sequentiell) und III (marginal) identische Ergebnisse liefern.
  • Der Unterschied liegt in den paarweisen Vergleichen von Kaskadenmodellen.
  • Die Funktion aov () hat auch ein Problem bei der Auswahl der Freiheitsgrade. Es scheint zwei Konzepte zu mischen: 1) die Summe der Quadrate aus den schrittweisen Vergleichen, 2) die Freiheitsgrade von einem Gesamtbild.


> data <- list(value = c (8.788269,7.964719,8.204051,9.041368,8.181555,8.0414149,7.992336,7.948658,8.090211,8.031459,8.118308,7.699051,7.537120,7.268570), time = c(1,6,12,24,48,96,144,1,6,12,24,48,96,144), treat = c(0,0,0,0,0,0,0,1,1,1,1,1,1,1) )
> summary( lm(value ~ treat*time, data=data) )
> summary( aov(value ~ 1 + treat + time + I(treat*time),data=data) )


#all linear models used in the explanation below
> model_0                      <- lm(value ~ 1, data)
> model_time                   <- lm(value ~ 1 + time, data)
> model_treat                  <- lm(value ~ 1 + treat, data)
> model_interaction            <- lm(value ~ 1 + I(treat*time), data)
> model_treat_time             <- lm(value ~ 1 + treat + time, data)
> model_treat_interaction      <- lm(value ~ 1 + treat + I(treat*time), data)
> model_time_interaction       <- lm(value ~ 1 + time + I(treat*time), data)
> model_treat_time_interaction <- lm(value ~ 1 + time + treat + I(treat*time), data)


# the t-test with the estimator and it's variance, mean square error, is
# related to the F test of pairwise comparison of models by dropping 1
# model parameter

> anova(model_treat_time_interaction, model_time_interaction)

Analysis of Variance Table

Model 1: value ~ 1 + time + treat + I(treat * time)
Model 2: value ~ 1 + time + I(treat * time)
  Res.Df     RSS Df Sum of Sq      F  Pr(>F)  
1     10 0.89985                              
2     11 1.21118 -1  -0.31133 3.4598 0.09251 .
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

> anova(model_treat_time_interaction, model_treat_interaction)

Analysis of Variance Table

Model 1: value ~ 1 + time + treat + I(treat * time)
Model 2: value ~ 1 + treat + I(treat * time)
  Res.Df     RSS Df Sum of Sq      F Pr(>F)
1     10 0.89985                           
2     11 1.14374 -1   -0.2439 2.7104 0.1307

> anova(model_treat_time_interaction, model_treat_time)

Analysis of Variance Table

Model 1: value ~ 1 + time + treat + I(treat * time)
Model 2: value ~ 1 + treat + time
  Res.Df     RSS Df Sum of Sq      F Pr(>F)
1     10 0.89985                           
2     11 0.93245 -1 -0.032599 0.3623 0.5606

> # which is the same as
> drop1(model_treat_time_interaction, scope  = ~time+treat+I(treat*time), test="F")

Single term deletions

value ~ 1 + time + treat + I(treat * time)
                Df Sum of Sq     RSS     AIC F value  Pr(>F)  
<none>                       0.89985 -30.424                  
time             1  0.243896 1.14374 -29.067  2.7104 0.13072  
treat            1  0.311333 1.21118 -28.264  3.4598 0.09251 .
I(treat * time)  1  0.032599 0.93245 -31.926  0.3623 0.56064  
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1


> #the aov function makes stepwise additions/drops
> #first the time, then treat, then the interaction
> anova(model_0, model_time)

Analysis of Variance Table

Model 1: value ~ 1
Model 2: value ~ 1 + time
  Res.Df    RSS Df Sum of Sq      F  Pr(>F)  
1     13 2.5902                              
2     12 1.8176  1    0.7726 5.1006 0.04333 *
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

> anova(model_time, model_treat_time)

Analysis of Variance Table

Model 1: value ~ 1 + time
Model 2: value ~ 1 + treat + time
  Res.Df     RSS Df Sum of Sq      F   Pr(>F)   
1     12 1.81764                                
2     11 0.93245  1    0.8852 10.443 0.007994 **
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

> anova(model_treat_time, model_treat_time_interaction)

Analysis of Variance Table

Model 1: value ~ 1 + treat + time
Model 2: value ~ 1 + time + treat + I(treat * time)
  Res.Df     RSS Df Sum of Sq      F Pr(>F)
1     11 0.93245                           
2     10 0.89985  1  0.032599 0.3623 0.5606

> # note that the sum of squares for within model variation is the same
> # but the F values and p-values are not the same because the aov 
> # function somehow chooses to use the degrees of freedom in the 
> # complete model in all stepwise changes


> # Although the p and F values do not exactly match, it is this effect
> # of order and selection of cascading or not in model comparisons. 
> # An important note to make is that the comparisons are made by 
> # stepwise additions and changing the order of variables has an 
> # influence on the outcome!
> # Additional note changing the order of 'treat' and 'time' has no 
> # effect because they are not correlated

> summary( aov(value ~ 1 + treat + time +I(treat*time), data=data) )

        Df Sum Sq Mean Sq F value Pr(>F)  
treat            1 0.8852  0.8852   9.837 0.0106 *
time             1 0.7726  0.7726   8.586 0.0150 *
I(treat * time)  1 0.0326  0.0326   0.362 0.5606  
Residuals       10 0.8998  0.0900                 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

> summary( aov(value ~ 1 + I(treat*time) + treat + time, data=data) )

                Df Sum Sq Mean Sq F value  Pr(>F)   
I(treat * time)  1 1.3144  1.3144  14.606 0.00336 **
treat            1 0.1321  0.1321   1.469 0.25343   
time             1 0.2439  0.2439   2.710 0.13072   
Residuals       10 0.8998  0.0900                   
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

> # This is an often forgotten quirck 
> # best is to use manual comparisons such that you know
> # and understand your hypotheses
> # (which is often forgotten in the click and
> #     point anova modelling tools)
> #
> # anova(model1, model2) 
> #     or use 
> # stepAIC from the MASS library
