Ich versuche festzustellen, ob Raupen, die sich natürlich ernähren (Affenblume), resistenter gegen Raubtiere (Ameisen) sind als Raupen, die sich künstlich ernähren (eine Mischung aus Weizenkeimen und Vitaminen). Ich habe eine Versuchsstudie mit einer kleinen Stichprobengröße (20 Raupen; 10 pro Diät) durchgeführt. Ich habe jede Raupe vor dem Experiment gewogen. Ich bot einer Gruppe von Ameisen für einen Zeitraum von fünf Minuten ein Paar Raupen an (eine pro Diät) und zählte, wie oft jede Raupe abgelehnt wurde. Ich habe diesen Vorgang zehnmal wiederholt.
So sehen meine Daten aus (A = künstliche Ernährung, N = natürliche Ernährung):
Trial A_Weight N_Weight A_Rejections N_Rejections
1 0.0496 0.1857 0 1
2 0.0324 0.1112 0 2
3 0.0291 0.3011 0 2
4 0.0247 0.2066 0 3
5 0.0394 0.1448 3 1
6 0.0641 0.0838 1 3
7 0.0360 0.1963 0 2
8 0.0243 0.145 0 3
9 0.0682 0.1519 0 3
10 0.0225 0.1571 1 0
Ich versuche, eine ANOVA in R auszuführen. So sieht mein Code aus (0 = künstliche Ernährung, 1 = natürliche Ernährung; alle Vektoren werden zuerst mit Daten für die zehn Raupen mit künstlicher Ernährung organisiert, gefolgt von Daten für die zehn natürlichen Diäten Raupen):
diet <- factor (rep (c (0, 1), each = 10)
rejections <- c(0,0,0,0,3,1,0,0,0,1,1,2,2,3,1,3,2,3,3,0)
weight <- c(0.0496,0.0324,0.0291,0.0247,0.0394,0.0641,0.036,0.0243,0.0682,0.0225,0.1857,0.1112,0.3011,0.2066,0.1448,0.0838,0.1963,0.145,0.1519,0.1571)
all.data <- data.frame(Diet=diet, Rejections = rejections, Weight = weight)
fit.all <- lm(Rejections ~ Diet * Weight, all.data)
anova(fit.all)
Und so sehen meine Ergebnisse aus:
Analysis of Variance Table
Response: Rejections
Df Sum Sq Mean Sq F value Pr(>F)
Diet 1 11.2500 11.2500 9.8044 0.006444 **
Weight 1 0.0661 0.0661 0.0576 0.813432
Diet:Weight 1 0.0748 0.0748 0.0652 0.801678
Residuals 16 18.3591 1.1474
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Meine Fragen sind:
- Ist ANOVA hier angemessen? Mir ist klar, dass die geringe Stichprobengröße bei jedem statistischen Test ein Problem darstellen würde. Dies ist nur eine Teststudie, für die ich Statistiken für eine Klassenpräsentation erstellen möchte. Ich habe vor, diese Studie mit einer größeren Stichprobe zu wiederholen.
- Habe ich meine Daten korrekt in R eingegeben?
- Sagt mir das, dass Ernährung wichtig ist, Gewicht aber nicht?
Antworten:
tl; dr @whuber hat recht, dass Ernährung und Gewicht in Ihrer Analyse verwechselt werden: So sieht das Bild aus.
Die Fettpunkte + Bereiche zeigen den Mittelwert und das Bootstrap-Konfidenzintervall nur für die Ernährung. Die graue Linie + Konfidenzintervall zeigt die Gesamtbeziehung zum Gewicht. Die einzelnen Linien + CI zeigen die Beziehungen zum Gewicht für jede Gruppe. Es gibt mehr Ablehnung für Diät = N, aber diese Personen haben auch höhere Gewichte.
Gehen Sie auf die blutigen mechanischen Details ein: Sie sind mit Ihrer Analyse auf dem richtigen Weg, aber (1) wenn Sie die Wirkung der Ernährung testen, müssen Sie die Wirkung des Gewichts berücksichtigen und umgekehrt ; Standardmäßig führt R eine sequentielle ANOVA durch, bei der die Wirkung der Ernährung allein getestet wird. (2) Für solche Daten sollten Sie wahrscheinlich ein verallgemeinertes lineares Poisson-Modell (GLM) verwenden, obwohl es in diesem Fall keinen großen Unterschied zu den statistischen Schlussfolgerungen macht.
Wenn Sie sich
summary()
eher ansehen alsanova()
, was marginale Effekte testet, werden Sie feststellen, dass nichts besonders bedeutsam aussieht (Sie müssen auch vorsichtig sein, wenn Sie die Haupteffekte bei Vorhandensein einer Interaktion testen: In diesem Fall wird die Wirkung der Ernährung bei a bewertet Gewicht Null : wahrscheinlich nicht sinnvoll, aber da die Wechselwirkung nicht signifikant ist (obwohl sie einen großen Effekt hat!), macht sie möglicherweise keinen großen Unterschied.Zentrieren der Gewichtsvariablen:
Keine großen Änderungen in der Geschichte hier.
Es gibt einige Argumente dafür, ob sogenannte "Typ 3" -Tests sinnvoll sind; Sie tun es nicht immer, obwohl das Zentrieren des Gewichts hilft. Eine Typ-2-Analyse, bei der die Haupteffekte nach dem Herausnehmen der Interaktion aus dem Modell getestet werden, ist möglicherweise vertretbarer. In diesem Fall werden Ernährung und Gewicht in Gegenwart voneinander getestet, jedoch ohne die enthaltenen Wechselwirkungen.
Wir können sehen, dass wir, wenn wir die Ernährung ohne Berücksichtigung der Auswirkungen des Gewichts analysieren , ein hoch signifikantes Ergebnis erzielen würden - dies ist im Wesentlichen das, was Sie aufgrund der sequentiellen ANOVA in Ihrer Analyse gefunden haben.
Es wäre üblicher, diese Art von Daten an ein Poisson GLM (
glm(rejections~diet*cweight,data=dd2,family=poisson)
) anzupassen , aber in diesem Fall macht es keinen großen Unterschied zu den Schlussfolgerungen.Übrigens ist es besser, Ihre Daten programmgesteuert neu zu ordnen, als von Hand, wenn Sie können. Als Referenz habe ich das so gemacht (Entschuldigung für die Menge an "Magie", die ich verwendet habe):
Plotcode:
quelle