Es gibt zwei Möglichkeiten, Ihre erste Frage zu interpretieren, die sich in den beiden von Ihnen gestellten Fragen widerspiegeln: "Werden Arten mit Wirtspflanzen in Verbindung gebracht?"
Die erste Interpretation entspricht einem Modell der gemeinsamen Unabhängigkeit , das besagt, dass Arten und Wirte abhängig sind, aber gemeinsam unabhängig davon, ob es geregnet hat:
pshr=pshpr
wo die Wahrscheinlichkeit ist , dass eine Beobachtung fällt in die Zelle , in - Indizes Arten, Host - Typ, und regt Wert, ist die Grenzwahrscheinlichkeit des Zelle, in der wir über der kollabieren und die marginale Regenwahrscheinlichkeit ist.pshr(s,h,r)shrpsh(s,h,⋅)pr
Die zweite Interpretation entspricht einem Modell der bedingten Unabhängigkeit , das besagt, dass Arten und Wirte unabhängig sind, vorausgesetzt, es hat geregnet:
psh|r=ps|rph|r oderpshr=psrphr/pr
Dabei ist die bedingte Wahrscheinlichkeit der -Zelle bei einem Wert von .psh|r(s,h,r)r
Sie können diese Modelle in R testen ( loglin
würde auch gut funktionieren, aber ich kenne mich besser aus glm
):
count <- c(12,15,10,13,11,12,12,7)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
my.data <- as.data.frame.table(my.table)
mod0 <- glm(Freq ~ species + host + rain, data=my.data, family=poisson())
mod1 <- glm(Freq ~ species * host + rain, data=my.data, family=poisson())
mod2 <- glm(Freq ~ (species + host) * rain, data=my.data, family=poisson())
anova(mod0, mod1, test="Chi") #Test of joint independence
anova(mod0, mod2, test="Chi") #Test of conditional independence
Dies mod1
entspricht der gemeinsamen Unabhängigkeit und mod2
der bedingten Unabhängigkeit, wohingegen dies mod0
einem Modell der gegenseitigen Unabhängigkeit entspricht: . Sie können die Parameterschätzungen mit usw. anzeigen. Wie üblich sollten Sie überprüfen, ob die Modellannahmen erfüllt sind. In den von Ihnen angegebenen Daten passt das Nullmodell tatsächlich angemessen.pshr=psphprsummary(mod2)
Eine andere Möglichkeit, sich Ihrer ersten Frage zu nähern, besteht darin, Fischers genauen Test ( fisher.test(xtabs(count ~ host + species))
) für die reduzierte 2x2-Tabelle (erste Interpretation) oder den Mantel-Haenszel-Test ( mantelhaen.test(xtabs(count ~ host + species + rain))
) für 2-schichtige 2x2-Tabellen durchzuführen oder einen Permutationstest zu schreiben, der die Schichtung berücksichtigt (zweite Interpretation).
Um Ihre zweite Frage zu paraphrasieren: Hängt die Beziehung zwischen Art und Wirt davon ab, ob es geregnet hat?
mod3 <- glm(Freq ~ species*host*rain - species:host:rain, data=my.data, family=poisson())
mod4 <- glm(Freq ~ species*host*rain, data=my.data, family=poisson())
anova(mod3, mod4, test=”Chi”)
pchisq(deviance(mod3), df.residual(mod3), lower=F)
Das vollständige Modell mod4
ist gesättigt, aber Sie können den fraglichen Effekt testen, indem Sie die Abweichung von mod3
wie oben beschrieben betrachten.
Der R-Befehl wäre:
quelle
Anfangs habe ich vorgeschlagen, eine der eingeschränkten Ordinationstechniken aus dem
vegan
Paket auszuprobieren , aber bei einem zweiten Gedanken bezweifle ich, dass dies nützlich wäre, da Sie tatsächlich 2 Kontingenztabellen haben. Ich hoffe, dass der zweite Teil dieses Beispiels [PDF: R Demonstration - Categorical Analysis] hilfreich sein wird.quelle