Ich habe viele Hilfeseiten durchsucht und bin immer noch verwirrt darüber, wie kompliziertere verschachtelte Begriffe auch in einem gemischten Modell angegeben werden können. Ich bin auch verwirrt über die Verwendung von :
und /
und die |
Angabe von Wechselwirkungen und Verschachtelungen mit Zufallsfaktoren, die lmer()
im lme4
Paket in verwendet werden R
.
Für diese Frage nehmen wir an, dass ich meine Daten mit diesem statistischen Standardmodell korrekt dargestellt habe: ist festgelegt, und sind zufällig. ist (implizit) verschachtelt in .
station
tow
day
Tow
station
Mit anderen Worten, ich hoffe, dass mein Modell Station (i, fest), Tow (j, zufällig, implizit in Station verschachtelt), Tag (k, zufällig) und die Interaktion zwischen Tow und Tag sowie die Interaktion zwischen Tag umfasst und Station. Ich habe mich an einen Statistiker gewandt, um mein Modell zu erstellen, und bin zu diesem Zeitpunkt der Ansicht, dass es für meine Daten repräsentativ ist, werde aber auch eine Beschreibung meiner Daten für diejenigen hinzufügen, die am Ende meines Beitrags interessiert sind, um keine Unordnung zu verursachen.
Bisher konnte ich Folgendes zusammenfügen lmer
:
lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day),
data=my.data)
Stellt dies mein statistisches Modell genau dar? Irgendwelche Vorschläge, wie ich meinen Code verbessern kann, wenn er nicht richtig gelesen wird?
Ich habe die spezifischen Begriffe, die ich in meiner früheren Formel nur schwer angeben kann, fett gedruckt
# 1. Schlepptau innerhalb Station verschachtelt , wenn Schlepptau zufällig und Station befestigt ist
,
ich bin verwirrt, aber etwa zwischen verschachtelten und Interaktionsbedingungen Differenzierung , die zufällig sind mit :
und /
. In meinem obigen Beispiel habe ich, (1|station:tow)
in dem ich hoffe , dass es in der Station verschachtelt ist. Ich habe widersprüchliche Kommentare auf verschiedenen Seiten gelesen, ob ich :
oder /
hier im zufälligen (1|...)
Format verwenden soll lmer
.
# 2. Die Interaktion zwischen Station und Tag, wenn Station und Tag festgelegt sind, ist zufällig
, (1|station:day)
aber diesmal hoffe ich, dass sie die Interaktion zwischen Station und Tag liest. Es sieht so aus, als könnte ich station * day verwenden, um die individuellen Auswirkungen von station und day sowie deren Interaktion zu berücksichtigen (anstatt jeden der drei Begriffe wie oben beschrieben separat einzubeziehen), aber ich verstehe nicht, wie ich das spezifizieren soll wenn einer feststeht und der andere zufällig ist. Würde das station*(1|day)
machen?
#3. Die Interaktion zwischen Schlepptau und Tag (beide zufällig), an dem Schlepptau in Station verschachtelt ist (feststehend)
Als letztes habe (1|tow:day)
ich, wie ich hoffe, die Interaktion von tow
und gelesen day
, aber ich frage mich, ob ich erneut angeben muss, dass Schlepptau verschachtelt ist (implizit) im Bahnhof?
Ich bin sowohl R
mit der lmer
statistischen Modellierung als auch mit der statistischen Modellierung neu und schätze die Mühe gründlicher Erklärungen bei der Beantwortung meiner Fragen, wenn möglich, sehr.
Weitere Details zu meinen Daten: Ich frage, ob sich die Planktonkonzentrationen an einer physischen Front im küstennahen Ozean unterscheiden. Ich habe drei Stationen an Land, innerhalb und vor der Küste dieser Front. Station ist damit fixiert. An jeder Station nehme ich drei Replikat-Plankton-Kabel (von denen ich sortiere, zähle und eine Konzentration in Bezug auf die Anzahl der Insekten pro Kubikmeter Wasser erhalte). Schlepptau ist zufällig: Ich hoffe, in drei Schlepptauen die allgemeine Variabilität des Planktons an dieser bestimmten Station erklären zu können. Tow ist eigenständig in der Station verschachtelt, da jedes Tow keine eindeutige ID hat (123.123.123 ist die ID für Tows an jeder Station). Ich tat dies dann an mehreren unabhängigen Tagen mit einer neuen Front, die sich gebildet hatte. Ich denke, ich kann mir den Tag als blockierenden Faktor vorstellen? Der Tag ist zufällig, da das Wiederholen dieses Vorgangs an mehreren unabhängigen Fronttagen versucht, die Variabilität von Tag zu Tag zu erfassen und für alle Tage repräsentativ zu sein, an denen diese Front vorhanden ist. Ich möchte über die Interaktionsbedingungen informiert werden, um zu sehen, ob sich die Schwankungsbreite von Tag zu Tag ändert und ob Stationen immer ähnliche Daten liefern oder ob dies vom Tag abhängt.
Nochmals vielen Dank für Ihre Zeit und Hilfe, ich weiß es zu schätzen!
quelle
R
Syntax und IMO ausreichend statistisch (um zu verstehen, wie sich das angegebene Modell auf Verschachtelung und Interaktionen usw. bezieht), um zum Thema zu gehören für Lebenslauf.lmer()
Syntax haben Sie ein Modell angegeben, bei dem es einen festen Effekt vonstation
und vier zufällige Abschnitte gibt, die von Personen mit derselben (1) Kombination vonstation
undtow
, (2) Wert vonDay
, (3) Kombination vonstation
undday
und ( 4) Kombination vontow
undday
, respectively. Ist es das, was du beabsichtigt hast? Ich bin mir nicht sicher, da, wie von @BabekP angegeben, nicht klar ist, wie Sie Ihre Modellformulierung geschrieben haben. Sie haben Variablennamen und keine Parameter geschrieben. Normalerweise werden in einem Modell wie diesem die Variablenkombinationen von den Indizes erfasst.Antworten:
Schlepptau in Station verschachtelt, wenn Schlepptau zufällig ist und die Station feststeht
station+(1|station:tow)
ist richtig. Wie @John in seiner Antwort sagte,(1|station/tow)
würde sich erweitern auf(1|station)+(1|station:tow)
(Haupteffekt der Station plus Interaktion zwischen Schlepptau und Station), was Sie nicht wollen, weil Sie die Station bereits als festen Effekt angegeben haben.Interaktion zwischen Station und Tag, wenn die Station fest und der Tag zufällig ist.
Die Wechselwirkung zwischen einem festen und einem zufälligen Effekt ist immer zufällig. Wieder wie @John sagte,
station*day
erweitert sich zustation+day+station:day
, was Sie (wieder) nicht wollen, weil Sie bereitsday
in Ihrem Modell angegeben haben. Ich glaube nicht, dass es eine Möglichkeit gibt, das zu tun, was Sie wollen, und die gekreuzten Effekte vonday
(zufällig) undstation
(behoben) zu reduzieren, aber Sie könnten schreibenstation+(1|day/station)
, wenn Sie möchten, was sich wie in der vorherigen Antwort angegeben erweitern würdestation + (1|day) + (1|day:station)
.Interaktion zwischen dem Schlepptau und dem Tag, an dem das Schlepptau in der Station verschachtelt ist
Weil Sie nicht eindeutige Werte der haben keine
tow
Variable (dh weil , wie Sie sagen , unten schleppt angegeben werden als1
,2
,3
an jeder Station, Sie tun müssen , die Verschachtelung zu spezifizieren, wie(1|station:tow:day)
. Wenn Sie die Kabel eindeutig angegeben hatte, konnte man entweder(1|tow:day)
oder(1|station:tow:day)
(Sie sollten gleichwertige Antworten geben.) Wenn Sie in diesem Fall die Verschachtelung nicht angeben,lme4
versuchen Sie, einen zufälligen Effekt abzuschätzen, der von Schlepptau Nr. 1 an allen Stationen geteilt wird.station:tow:day
Sind http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specification und http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed für Sie nützlich?
quelle
B
es verschachtelt istA
oder nur damit interagiert, hängt davon ab, ob der Haupteffekt vonA
im Modell enthalten ist oder nicht. Wenn der HaupteffektB
ist auch in dem Modell dann ist es überquert ...Einige der Dinge in der Formel sind etwas verwirrend. Das
:
ist für Interaktionen zwischen zwei Begriffen, während das*
für Haupteffekte und Interaktionen ist. Das/
ist ein anderes für Interaktionen, aber es erzeugt eine Interaktion zwischen dem Zähler und allen Begriffen im Nenner (zA/(B+C) = A:B + A:C
. B. ). Das|
ist für so etwas wie "gruppiert nach". So1|station
würde Intercept von Station gruppiert und in Klammern ist es zufällig(1|station)
. So würdest du nisten.Hoffentlich ist das eine Hilfe. Es ist etwas seltsam, einen zufälligen Effekt in einem festen Effekt zu haben, und ich bin mir nicht sicher, wie Sie das darstellen würden. Ich kann mir die Situation gar nicht vorstellen. Sie erhalten möglicherweise eine bessere Antwort, wenn Sie nur erläutern, was Ihre Variablen sind und was Sie erreichen möchten. Oft stellen Leute Fragen und verwenden die Terminologie falsch und es ist schwierig zu kommunizieren. Erklären Sie, was die Variablen darstellen und was Sie darüber wissen möchten.
Wenn Sie sich in Ihrem letzten Absatz auf Ihre Beschreibung konzentrieren, scheint Ihr Kabel lediglich ein Indikator für die von Ihnen gesammelten Stichproben zu sein, und Sie brauchen keine Schätzungen in dem Sinne, dass Sie erwarten, dass sich Kabel 1 in irgendeiner Weise konsequent von Kabel 2 unterscheidet. Tow zeigt nur eine Probe an. Wenn Sie nicht wirklich glauben, dass die Reihenfolge der Schlepptau wichtig ist, kümmern Sie sich nicht einmal um diese Variable. Und wenn es darauf ankam, dann war es ein fester Effekt (und vielleicht ein zufälliger, aber kein rein zufälliger Effekt). Sie sagen, Sie möchten wissen, ob sich die Variabilität der Schleppseile von Tag zu Tag ändert. Wie wäre es mit der Antwort ja? Es ist nicht realistisch, dass sie sich von Tag zu Tag ändern. Es ist nur die Varianz Ihrer Maße. Du' Es ist nicht erlaubt, zu versuchen, jede Varianzspezifikation zu berücksichtigen, da dann keine Varianz mehr für einen Fehler übrig bleibt. Sie hätten ein überbestimmtes Modell. Sie wären gerade dabei, jede Maßnahme zu melden.
Sie machen eine ähnliche Aussage über die Frage, ob die Station von Tag zu Tag variiert. natürlich tut es das. Aber vielleicht meinst du bestimmte Tage? Waren die Tage in irgendeiner Weise nach Jahreszeit, Mondzyklus usw. gruppiert? Wenn Sie nicht nur Tag 1, sondern auch Tag 2 haben, wie können Sie dann feststellen, dass die Stationen von Tag zu Tag anders sind als die Stationen? Die Antwort auf diese Frage ist natürlich, dass die Stationen von Tag zu Tag variieren. Und natürlich variieren die Schlepptau- che von Tag zu Tag und von Station zu Station. Am Ende haben Sie ein einfaches Modell:
Der einzige feste Effekt, den Sie hier haben, Station, wird nur über mehrere Schlepptau- che und mehrere Tage hinweg abgetastet. Ich bin mir nicht sicher, ob Sie hier überhaupt eine mehrstufige Modellierung benötigen. Es hört sich so an, als würden Sie Ihr Modell zu sehr spezifizieren.
Wenn Sie wirklich zufällige Tag- und Abschleppeffekte wünschen und Informationen haben, die Sie hier nicht angegeben haben, können Sie sie zu einem mehrstufigen Modell erweitern. Das wäre:
Sie benötigen jedoch mehrere Schleppseile an jeder Station und an jedem Tag, um dieses Modell zu verwenden.
quelle