Wie sind ANOVA und MANOVA vom Typ I, Typ II und Typ III zu interpretieren?

45

Meine Hauptfrage ist, wie die Ausgabe (Koeffizienten, F, P) bei der Durchführung einer (sequentiellen) ANOVA vom Typ I zu interpretieren ist.

Mein spezielles Forschungsproblem ist etwas komplexer, deshalb werde ich mein Beispiel in Teile zerlegen. Wenn ich mich zuerst für die Auswirkung der Spinnendichte (X1) auf das Pflanzenwachstum (Y1) interessiere und Setzlinge in Gehege pflanzte und die Spinnendichte manipulierte, kann ich die Daten mit einer einfachen ANOVA oder linearen Regression analysieren. Dann wäre es egal, ob ich für meine ANOVA die Quadratsumme (SS) Typ I, II oder III verwendet hätte. In meinem Fall habe ich 4 Wiederholungen von 5 Dichtestufen, sodass ich die Dichte als Faktor oder als stetige Variable verwenden kann. In diesem Fall ziehe ich es vor, es als kontinuierliche unabhängige (Prädiktor-) Variable zu interpretieren. In RI könnte Folgendes ausgeführt werden:

lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)

Das Ausführen der Anova-Funktion ist hoffentlich zu einem späteren Zeitpunkt für einen Vergleich sinnvoll. Die Ausgabe ist:

Response: y1
          Df  Sum Sq Mean Sq F value  Pr(>F)  
density    1 0.48357 0.48357  3.4279 0.08058 .
Residuals 18 2.53920 0.14107 

Nehmen wir an, ich vermute, dass der Anfangsgehalt an anorganischem Stickstoff im Boden, den ich nicht kontrollieren konnte, auch das Pflanzenwachstum erheblich beeinflusst hat. Ich bin nicht besonders an diesem Effekt interessiert, möchte aber möglicherweise die dadurch verursachten Schwankungen berücksichtigen. Wirklich, mein Hauptinteresse gilt den Auswirkungen der Spinnendichte (Hypothese: Erhöhte Spinnendichte führt zu erhöhtem Pflanzenwachstum - vermutlich durch Reduzierung pflanzenfressender Insekten, aber ich teste nur den Effekt, nicht den Mechanismus). Ich könnte die Wirkung von anorganischem N zu meiner Analyse hinzufügen.

Nehmen wir für meine Frage an, ich teste die Wechselwirkungsdichte * anorganischN und sie ist nicht signifikant, also entferne ich sie aus der Analyse und führe die folgenden Haupteffekte aus:

> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table

Response: y1
           Df  Sum Sq Mean Sq F value  Pr(>F)  
density     1 0.48357 0.48357  3.4113 0.08223 .
inorganicN  1 0.12936 0.12936  0.9126 0.35282  
Residuals  17 2.40983 0.14175 

Jetzt macht es einen Unterschied, ob ich SS vom Typ I oder Typ II verwende (ich weiß, dass einige Leute die Begriffe Typ I und II ablehnen, aber angesichts der Beliebtheit von SAS ist es einfach, sich kurz zu fassen). R anova {stats} verwendet standardmäßig Typ I. Ich kann die Dichte von Typ II SS, F und P durch Umkehren der Reihenfolge meiner Haupteffekte berechnen oder das "Auto" -Paket von Dr. John Fox (Begleiter der angewandten Regression) verwenden. Ich bevorzuge die letztere Methode, da es bei komplexeren Problemen einfacher ist.

library(car)
Anova(lm2)
            Sum Sq Df F value  Pr(>F)  
density    0.58425  1  4.1216 0.05829 .
inorganicN 0.12936  1  0.9126 0.35282  
Residuals  2.40983 17  

Mein Verständnis ist, dass Hypothesen vom Typ II lauten würden: "Es gibt keine lineare Auswirkung von x1 auf y1, wenn man die Auswirkung von (Konstante halten?) X2 annimmt" und dasselbe für x2, wenn man x1 annimmt. Ich denke, hier bin ich verwirrt. Welche Hypothese wird von der ANOVA mit der oben beschriebenen (sequentiellen) Methode vom Typ I im Vergleich zur Hypothese mit der Methode vom Typ II getestet?

In Wirklichkeit sind meine Daten etwas komplexer, da ich zahlreiche Messgrößen für das Pflanzenwachstum sowie die Nährstoffdynamik und die Streuzersetzung gemessen habe. Meine eigentliche Analyse ist so etwas wie:

Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)

Type II MANOVA Tests: Pillai test statistic
        Df test stat approx F num Df den Df  Pr(>F)    
density  1   0.34397        1      5     12 0.34269    
nitrate  1   0.99994    40337      5     12 < 2e-16 ***
Npred    1   0.65582        5      5     12 0.01445 * 


# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)

          Df  Pillai approx F num Df den Df  Pr(>F)    
density    1 0.99950     4762      5     12 < 2e-16 ***
nitrate    1 0.99995    46248      5     12 < 2e-16 ***
Npred      1 0.65582        5      5     12 0.01445 *  
Residuals 16                                           
djhocking
quelle

Antworten:

71

Was Sie Typ II SS nennen, würde ich Typ III SS nennen. Stellen wir uns vor, dass es nur zwei Faktoren A und B gibt (und wir werden die A * B-Wechselwirkung später einsetzen, um SS vom Typ II zu unterscheiden). Ferner lässt sich vorstellen, dass es unterschiedlich sind s in den vier Zellen (zB = 11, = 9, = 9 und = 11). Jetzt sind Ihre beiden Faktoren miteinander korreliert. (Versuchen Sie es selbst, machen Sie zwei Spalten mit Einsen und Nullen und korrelieren Sie sie, ; nb ist es egal, ob "signifikant" ist, das ist die gesamte Population, die Sie interessiert). Das Problem bei der Korrelation Ihrer Faktoren besteht darin, dass mit beiden Quadratsummen verknüpft sindnn11n12n21n22r=.1rA und B. Wenn eine ANOVA Berechnung (oder jede andere lineare Regression), möchten wir partitionieren die Summen der Quadrate. Eine Partition fasst alle Quadratsummen zu einer einzigen zusammenvon mehreren Teilmengen. (Zum Beispiel möchten wir die SS möglicherweise in A, B und Fehler aufteilen.) Da Ihre Faktoren (hier immer noch nur A und B) jedoch nicht orthogonal sind, gibt es keine eindeutige Aufteilung dieser SS. Tatsächlich kann es sehr viele Partitionen geben, und wenn Sie bereit sind, Ihre SS in Brüche aufzuteilen (z. B. "Ich werde 0,5 in diesen und 0,5 in diesen Behälter legen"), gibt es unendlich viele Partitionen. Eine Möglichkeit, dies zu veranschaulichen, besteht darin, sich das MasterCard-Symbol vorzustellen: Das Rechteck stellt die gesamte SS dar, und jeder der Kreise stellt die SS dar, die diesem Faktor zugeordnet werden können. Beachten Sie jedoch die Überlappung zwischen den Kreisen in der Mitte. Diese SS könnte angegeben werden zu jedem Kreis.

Bildbeschreibung hier eingeben

Die Frage ist: Wie können wir aus all diesen Möglichkeiten die 'richtige' Partition auswählen? Lassen Sie uns die Interaktion wieder aufnehmen und einige Möglichkeiten diskutieren:

Typ I SS:

  • SS (A)
  • SS (B | A)
  • SS (A * B | A, B)

Typ II SS:

  • SS (A | B)
  • SS (B | A)
  • SS (A * B | A, B)

Typ III SS:

  • SS (A | B, A * B)
  • SS (B | A, A * B)
  • SS (A * B | A, B)

Beachten Sie, wie diese verschiedenen Möglichkeiten funktionieren. Nur SS vom Typ I verwendet diese SS tatsächlich im überlappenden Teil zwischen den Kreisen im MasterCard-Symbol. Das heißt, die SS, die entweder A oder B zugeordnet werden können, werden tatsächlich einem von ihnen zugeordnet, wenn Sie SS des Typs I verwenden (insbesondere demjenigen, den Sie zuerst in das Modell eingegeben haben). In den beiden anderen Ansätzen werden die überlappenden SS nicht verwendet überhaupt . Somit gibt Typ I SS A die gesamte SS, die A zugeordnet werden kann (einschließlich derjenigen, die auch an anderer Stelle zugeordnet werden könnten), dann B alle verbleibenden SS, die B zugeordnet werden können, und dann A * B alle Wechselwirkungen der verbleibendenSS, die A * B zugeordnet werden können und die Reste hinterlässt, die dem Fehlerausdruck nicht zugeordnet werden können.

Typ III SS gibt nur A jene SS, die eindeutig A zuzuordnen sind, ebenso gibt es nur B und die Wechselwirkung jene SS, die eindeutig ihnen zuzuordnen sind. Der Fehlerbegriff erhält nur die SS, die keinem der Faktoren zugeordnet werden konnten. Daher werden diese "mehrdeutigen" SS, die zwei oder mehr Möglichkeiten zugeordnet werden könnten, nicht verwendet. Wenn Sie die SS des Typs III in einer ANOVA-Tabelle summieren, werden Sie feststellen, dass sie nicht der gesamten SS entsprechen. Mit anderen Worten, diese Analyse muss falsch sein, aber sie ist epistemisch konservativ. Viele Statistiker finden diesen Ansatz ungeheuerlich, aber staatliche Finanzierungsagenturen (ich glaube, die FDA) benötigen ihren Einsatz.

Der Typ-II-Ansatz soll erfassen, was an der Idee hinter Typ III sinnvoll sein könnte, aber gegen die Exzesse abmildern. Insbesondere wird nur die SS für A und B für einander angepasst, nicht die Interaktion. In der Praxis wird jedoch im Wesentlichen niemals Typ II SS verwendet. Sie müssen über all dies Bescheid wissen und mit Ihrer Software klug genug sein, um diese Schätzungen zu erhalten, und die Analysten, die normalerweise der Meinung sind, dass dies ein Trottel ist.

Es gibt mehr Arten von SS (ich glaube IV und V). Sie wurden in den späten 60er Jahren vorgeschlagen, sich mit bestimmten Situationen zu befassen, aber es wurde später gezeigt, dass sie nicht das tun, was gedacht wurde. An dieser Stelle handelt es sich also nur um eine historische Fußnote.

Welche Fragen diese beantworten, haben Sie grundsätzlich schon in Ihrer Frage richtig:

  • Schätzungen mit Typ I SS sagen Ihnen, wie viel von der Variabilität in Y durch A erklärt werden kann, wie viel von der Restvariabilität durch B erklärt werden kann, wie viel von der verbleibenden Restvariabilität durch die Wechselwirkung erklärt werden kann und so weiter. in Ordnung .
  • Die Schätzungen basieren auf Typ III SS Ihnen sagen , wie viel von der Rest Variabilität in Y entfielen von A werden können , nachdem sonst für alles berücksichtigt haben, und wie viel der Rest Variabilität in Y kann durch B berücksichtigt werden , nachdem für alles entfielen sonst haben auch und so weiter. (Beachten Sie, dass beide gleichzeitig als erstes und als letztes ausgeführt werden. Wenn dies für Sie sinnvoll ist und Ihre Forschungsfrage genau widerspiegelt, verwenden Sie SS Typ III.)
gung - Wiedereinsetzung von Monica
quelle
2
Vielen Dank für die sehr hilfreiche Antwort. Der andere Bereich, in dem ich verwirrt bin, ist, dass wenn "Schätzungen unter Verwendung von Typ I SS Ihnen sagen, wie viel von der Variabilität in Y durch A erklärt werden kann, wie viel von der Restvariabilität durch B erklärt werden kann, wie viel von dem verbleibenden Rest Variabilität kann durch die Interaktion erklärt werden und so weiter. "Warum ändern sich dann die mit A verknüpften Statistiken, wenn zusätzliche Variablen hinzugefügt werden? Liegt es daran, dass die Tests auf SS (A) / SS (Fehler) basieren und der Fehler eine Funktion aller Terme im Modell ist? Denke ich richtig darüber nach?
Djhocking
1
Mit "Statistiken in Verbindung mit A" meine ich die F- und p-Werte für den Haupteffekt von A. Der F-Wert für A ist das Verhältnis des mittleren Quadrats für A (dh SSA / dfA) zum MS Fehler. Wenn Sie weitere Faktoren hinzufügen, wird SS aus dem Fehlerausdruck entnommen und diesen Faktoren zugewiesen. Im Allgemeinen bedeutet dies, dass der MS-Fehler abnimmt und somit das Verhältnis zunimmt. Infolgedessen wird der F-Wert für A größer und der p-Wert wird kleiner. Weil sich auch die Freiheitsgrade ändern, kann es komplizierter sein, aber das ist der Kern.
gung - Reinstate Monica
Hoppla, ich habe MS (A) / MSE für die F-Statistik gemeint. Wie auch immer, Ihre Antwort ist perfekt. Nochmals vielen Dank für Ihre Hilfe!
Djhocking
Ich bin neugierig auf die Details der Interpretation, wenn ich einen Typ I verwende. In meinem Fall ist die Dichte meine einzige interessierende Variable und die einzige, die ich experimentell manipuliert habe. Wie bedauerlich es auch sein mag, die Dichte ist für sich allein oder nach Berücksichtigung meiner beiden anderen interessierenden Variablen (Npredatoren, anorganisches N in Typ II oder III) unbedeutend. Aber weil anorganisches N anscheinend einen großen Teil der Variation in einigen abhängigen Variablen erklärt, wenn ich es als dritte Variable hinzufüge, macht es die anderen 2 hoch signifikant. Hat die Dichte wirklich einen signifikanten Einfluss auf Y? Ist das vernünftig?
Djhocking
2
@ JonBonJovi, die MasterCard-Analogie hat nur 2 Faktoren. Wenn Sie 2 Faktoren plus eine Interaktion wünschen, benötigen Sie 3 Bereiche, die sich etwas überlappen. Es ist sicherlich möglich, ein Euler-Diagramm mit drei Bereichen zu zeichnen, aber ich habe der Einfachheit halber nur das MasterCard-Symbol verwendet. Stellen Sie sich für eine Interaktion einen dritten Kreis vor, der die ersten beiden überlappt (z. B. könnte er von rechts nach links zentriert sein, aber meistens über den anderen). dann geht der gesamte A-Kreis (SS) zu A, alles in B, was A nicht überlappt, geht zu B, und alles in A, was A oder B nicht überlappt, geht zu der Interaktion.
gung - Wiedereinsetzung von Monica