Modelldesign mit gemischten Effekten und Stichprobenvariable

11

Ich versuche, eine Formel für ein lineares Mischeffektmodell (mit lme4) für mein experimentelles Design anzugeben , bin mir aber nicht sicher, ob ich es richtig mache.

Das Design: Im Grunde messe ich einen Antwortparameter an Pflanzen. Ich habe 4 Behandlungsstufen und 2 Bewässerungsstufen. Die Pflanzen sind in 16 Parzellen gruppiert, wobei in jeder Parzelle I 4 Unterparzellen beprobt werden. In jeder Teilfläche nehme ich zwischen 15 und 30 Beobachtungen (abhängig von der Anzahl der gefundenen Pflanzen). Das heißt, es gibt insgesamt 1500 Zeilen.

Geben Sie hier die Bildbeschreibung ein

Ursprünglich war die Subplot-Ebene nur zu Stichprobenzwecken hier, aber ich dachte, ich würde sie gerne im Modell berücksichtigen (als Variable mit 64 Ebenen), da ich sah, dass es von einer Subplot-zur anderen eine große Variabilität gibt , sogar innerhalb derselben Parzelle (größer als die Variabilität zwischen ganzen Parzellen).

Meine erste Idee war zu schreiben:

library(lme4)
fit <- lmer(y ~ treatment*irrigation + (1|subplot/plot), data=mydata)

oder

fit <- lmer(y ~ treatment*irrigation + (1|subplot) + (1|plot), data=mydata)

Ist das korrekt? Ich bin mir nicht sicher, ob ich beide Plot- / Subplot-Ebenen in meiner Formel behalten muss. Kein fester Effekt ist signifikant, aber die zufälligen Effekte sind sehr signifikant.

agenis
quelle

Antworten:

9

Ihr Modell sollte geschrieben sein als

fit <- lmer(y ~ treatment*irrigation + (1|plot/subplot), data=mydata)

als Nebenhandlungen sind innerhalb der Site verschachtelt. obwohl (1|plot)+ (1|subplot)funktionieren würde, wenn die Unterzeichnungen eindeutig gekennzeichnet sind (dh 1A, 1B, 1C, ..., 2A, 2B, 2C anstelle von A, B, C ..., A, B, C). Mein Buchkapitel von Fox et al. Die Ökologische Statistik beschreibt ein Beispiel für die Verschachtelung:

Andererseits kommt im Zeckenbeispiel jedes Küken nur in einer Brut vor, und jede Brut kommt nur an einer Stelle vor: Die Modellspezifikation lautet (1 | SITE/BROOD/INDEX)„Küken (INDEX) innerhalb der innerhalb der Stelle verschachtelten Brut“ oder gleichwertig (1 | SITE) + (1 | SITE:BROOD) + (1 | SITE:BROOD:INDEX). Wenn die Bruten und Küken eindeutig gekennzeichnet sind, damit die Software die Verschachtelung erkennen kann, (1 | SITE) + (1 | BROOD) + (1 | INDEX)funktioniert dies ebenfalls (nicht verwenden (1 | SITE) + (1 | SITE/BROOD) + (1 | SITE/BROOD/INDEX); dies führt zu redundanten Begriffen im Modell).

Andere Gedanken:

  • Weitere Informationen zu Verschachtelungs- und Modellspezifikationen finden Sie unter http://glmm.wikidot.com/faq
  • Sind Ihre Bewässerungsbehandlungen wirklich so organisiert, wie im obigen Schema gezeigt, dh nicht eingestreut? Oder dient das nur der Bequemlichkeit der grafischen Darstellung? Wenn erstere, dann haben Sie ein möglicherweise problematisches experimentelles Design ...
  • Da Untergrundstücke in Sites verschachtelt sind, wäre dies inferentiell in Ordnung (nach Murtaugh 2007 Ecology) "Einfachheit und Komplexität bei der Analyse ökologischer Daten" ), die Plotmittel zu verwenden und die Daten auf Parzellenebene zu analysieren.
  • Für das, was es wert ist, denke ich, dass Sie noch weiter gehen und auf die Handlungsebene aggregieren könnten; dann könnten Sie gemischte Modelle komplett überspringen und einfach tunlm(y~treatment*irrigation, data=my_aggregated_data)
Ben Bolker
quelle
Vielen Dank für Ihre Hilfe (ich habe 12 Stunden Zeit, um die +50 freizuschalten :( in der Tat hatte ich große Zweifel an der Benennung meiner Nebenhandlungen (4 oder 64 eindeutige Etiketten). Die Abbildung ist korrekt: Die Bewässerung ist nicht "zufällig", das heißt Leider stimme ich zu (sie sagten mir: "zu expansiv, um es anders zu machen"!). Danke für die Links. Noch eine Frage: Ich bekomme ein Residuendiagramm, das nicht gut aussieht: kegelförmig (wie folgt: "<"), Fehler scheint proportional zu den Y-Werten zu sein. Gibt es eine Möglichkeit, dies bei diesem Modelltyp zu korrigieren?
Gibt
1
Die naheliegendste Lösung (und eine, die häufig andere Probleme behebt) ist die Transformation der Antwort, meistens die Protokolltransformation.
Ben Bolker