Spickzettel ANOVA Alphabet Suppe & Regressionsäquivalente

18

Kann ich Hilfe bei diesem vorläufigen (in Bearbeitung befindlichen) Versuch erhalten, mich auf die Äquivalente von ANOVA und REGRESSION zu beziehen? Ich habe versucht, die Konzepte, die Nomenklatur und die Syntax dieser beiden Methoden in Einklang zu bringen. Es gibt viele Posts auf dieser Site über ihre Gemeinsamkeiten, zum Beispiel dieses oder jenes , aber es ist immer noch gut, eine schnelle "Sie sind hier" -Karte zu haben, wenn Sie anfangen.

Ich habe vor, diesen Beitrag zu aktualisieren, und hoffe, Hilfe bei der Korrektur von Fehlern zu erhalten.

Einweg-ANOVA:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

Zweiwege-ANOVA:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

Zwei-Wege-Faktorielle ANOVA:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANCOVA:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

MANCOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

INNERHALB EINER FAKTOR- (oder SUBJEKT-) ANOVA: ( Code hier )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ( Code hier )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

NESTED DESIGN: ( Code hier )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

NÜTZLICHE SEITEN:

  1. RExRepos
  2. Persönlichkeitsprojekt
  3. Quick-R
  4. R-Blogger
  5. Verschachtelte Analyse und Split-Plot von M. Crawley
  6. Modelle mit mehreren zufälligen Effekten
  7. Split-Plot-Modelle
  8. Das R-Buch von M. Crawley
  9. Innerhalb von Gruppen & Wiederholte Maßnahmen
  10. Wiederholen Sie die Messungen in R
  11. GLMM FAQ
Antoni Parellada
quelle
Eine Anmerkung: Für Ihre 2-Wege-ANOVA-Beispiele (direkt und faktoriell) ist Ihr Szenario / Ihre Syntax cyl + hp. Horespower ist kontinuierlich, funktioniert also hier nicht. carbwäre die Anzahl der Vergaser eine bessere Wahl.
Gregor
Vielen Dank! Flüchtigkeitsfehler. Dank Ihres Hinweises habe ich auch festgestellt, dass Zyl. Als kontinuierlich behandelt wurde, und habe ihn in as.factor geändert. Und ich habe TukeyHSD eingeschlossen.
Antoni Parellada
1
Ich denke, Sie sollten "Survival" aus dem Titel streichen, da dies ein sehr spezifischer Bereich der Statistik ist, der in keiner Beziehung zu dem steht, was Sie (sehr schön) zusammenfassen.
Bryan Hanson
Schöne Zusammenfassung Antoni! Vielleicht könnten Sie auch die glmmFAQs von Ben Bolker und einige einfache Binomial- und Poisson-Beispiele (GLM und GLMM) hinzufügen. Ich verstehe jedoch, dass dies die Dinge möglicherweise zu kompliziert macht und diese schöne und prägnante Zusammenfassung zunichte macht. Alternativ können Sie auf Beispiele auf dieser Site verlinken. Für ein komplettes einfaches Poisson / Negativ-Binomial-Beispiel könnte dies funktionieren: stats.stackexchange.com/questions/325334/…
Stefan

Antworten:

2

Schöne Liste, Antoni. Hier sind einige kleine Vorschläge:

Einweg-ANOVA: IV ist ein FAKTOR mit 3 oder mehr Stufen. Sie können diesem Eintrag auch ein Beispieldatum hinzufügen : mtcars . (In ähnlicher Weise können Sie allen Ihren Einträgen * Example Data "-Anweisungen hinzufügen, um klarer zu machen, welche Datensätze Sie verwenden.)

Zweiwege-Anova: Warum nicht IV1 und IV2 verwenden und angeben, dass die beiden unabhängigen Variablen Faktoren mit jeweils mindestens zwei Ebenen sein sollten? Die Art und Weise, wie Sie dies angegeben haben, deutet derzeit darauf hin, dass eine Zwei-Wege-Anova mehr als zwei unabhängige Variablen (oder Faktoren) enthalten könnte, was nicht sinnvoll ist.

Bei der Zwei-Wege-Anova würde ich zwischen diesen beiden Unterfällen unterscheiden: 1. Zwei-Wege-Anova mit Haupteffekten für IV1 und IV2 und 2. Zwei-Wege-Anova mit einer Wechselwirkung zwischen IV1 und IV2. Bei diesem zweiten Punkt handelt es sich um eine faktorielle Zwei-Wege-Anova.) Eine bessere Beschreibung dieser beiden Unterfälle wäre: 1. Die Auswirkung von IV1 auf DV ist unabhängig von der Auswirkung von IV2 und 2. Die Auswirkung von IV1 bei DV kommt es auf IV2 an. Sie könnten auch klarer machen, dass es die unabhängigen Variablen IV1 und IV2 sind, die in der Regressionseinstellung Dummy-codiert sind.

Für ANCOVA könnten Sie klarstellen, dass Sie in Ihrem aktuellen Beispiel nur Einweg-ANCOVA in Betracht ziehen. Der Vollständigkeit halber könnten Sie ein Zwei-Wege-ANCOVA-Beispiel ohne Wechselwirkungen zwischen IV1 und IV2 und eines mit Wechselwirkungen zwischen diesen beiden Variablen hinzufügen.

Zu all diesen Zwecken können Sie auch ein Element namens " Zweck" hinzufügen , in dem beschrieben wird, wann diese Analysen nützlich sind. Beispielsweise:

Zweck (der Einweganova): Untersuchen Sie, ob die Mittelwerte der DV in den verschiedenen Stufen der IV unterschiedlich sind.

Können Sie für MANOVA klarstellen, dass man (a) zwei oder mehr DVs und (2) eine oder mehrere IVs benötigt, die Faktoren sind? Ich vermute, Sie können zwischen Einweg-MANOVA (mit 1 Faktor) und Zweiweg-MANOVA unterscheiden? Gleiches gilt für MANCOVA.

Die WITHIN-FACTOR-ANOVA ist auch als REPEATED-MEASURES-ANOVA bekannt. Vielleicht können Sie diese Terminologie zu Ihrer Liste hinzufügen, wenn Sie mit der ANOVA vertraut sind. Es wäre auch hilfreich zu klären, dass die Modellierung gemischter Effekte eine Alternative zur Modellierung wiederholter Messdaten darstellt. Andernfalls können die Leser den Unterschied zwischen den beiden Ansätzen möglicherweise nicht einschätzen.

Isabella Ghement
quelle
Es ist für mich einfacher, Vorschläge zu machen, als Änderungen vorzunehmen. «
Isabella Ghement