Drei Formen eines „gemischten Modells“ interpretieren

19

Es gibt eine Unterscheidung, die mich mit gemischten Modellen auslöst, und ich frage mich, ob ich Klarheit darüber bekommen könnte. Nehmen wir an, Sie haben ein gemischtes Modell der Zähldaten. Es gibt eine Variable, von der Sie wissen, dass Sie sie als festen Effekt haben möchten (A) und eine andere Variable für die Zeit (T), die beispielsweise als "Site" -Variable gruppiert ist.

So wie ich es verstehe:

glmer(counts ~ A + T, data=data, family="Poisson") ist ein Modell mit festen Effekten.

glmer(counts ~ (A + T | Site), data=data, family="Poisson") ist ein Zufallseffektmodell.

Meine Frage ist, wenn Sie etwas haben wie:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")was ist T? Ist es ein zufälliger Effekt? Ein fester Effekt? Was wird eigentlich erreicht, wenn man T an beiden Stellen setzt?

Wann sollte etwas nur im Abschnitt für zufällige Effekte der Modellformel erscheinen?

Fomite
quelle

Antworten:

22

Dies wird möglicherweise deutlicher, wenn Sie die Modellformel für jedes dieser drei Modelle aufschreiben. Sei die Beobachtung für die Person in Site in jedem Modell und definiere analog, um sich auf die Variablen in Ihrem Modell zu beziehen. i j A i j , T i jY.ichjichjEINichj,Tichj

glmer(counts ~ A + T, data=data, family="Poisson") ist das Modell

Log(E(Y.ichj))=β0+β1EINichj+β2Tichj

Das ist nur ein gewöhnliches Poisson-Regressionsmodell.

glmer(counts ~ (A + T|Site), data=data, family="Poisson") ist das Modell

Log(E(Y.ichj))=α0+ηj0+ηj1EINichj+ηj2Tichj

Dabei sind zufällige Effekte, die bei jeder Beobachtung von Personen von Standort . Diese zufälligen Effekte dürfen in dem von Ihnen angegebenen Modell frei korreliert werden (dh es werden keine Einschränkungen für ). Um Unabhängigkeit zu erzwingen, muss man sie in verschiedene Klammern setzen, zB würde es tun. Dieses Modell geht davon aus, dass ist für alle Seiten , aber jede Seite hat eine zufällige Offset ( ) und hat eine zufällige lineare Beziehung mit sowohl .j log ( E ( Y i j ) ) α 0 η j 0 A i j , T i jηj=(ηj0,ηj1,ηj2)N(0,Σ)jΣ(A-1|Site) + (T-1|Site) + (1|Site)Log(E(Y.ichj))α0ηj0EINichj,Tichj

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") ist das Modell

Log(E(Y.ichj))=(θ0+γj0)+θ1EINichj+(θ2+γj1)Tichj

Also hat eine "durchschnittliche" Beziehung zu , gegeben durch die festen Effekte aber diese Beziehung ist für jede Site unterschiedlich und diese Unterschiede werden durch die Zufallseffekte . Das heißt, die Basislinie ist zufällig verschoben, und die Steigungen der beiden Variablen sind zufällig verschoben, und alle Benutzer derselben Site haben dieselbe zufällige Verschiebung. A i j , T i j θ 0 , θ 1 , & thgr; 2 γ j 0 , γ j 1 , γ j 2Log(E(Y.ichj))EINichj,Tichjθ0,θ1,θ2γj0,γj1,γj2

was ist T? Ist es ein zufälliger Effekt? Ein fester Effekt? Was wird eigentlich erreicht, wenn man T an beiden Stellen setzt?

T γ j 1 T log ( E ( Y i j ) )T ist eine deiner Kovariaten. Es ist kein zufälliger Effekt - es Siteist ein zufälliger Effekt. Es gibt einen festen Effekt von , der je nach dem zufälligen Effekt, den - im obigen Modell verleiht, unterschiedlich ist . Durch Einbeziehen dieses Zufallseffekts wird eine Heterogenität zwischen Standorten in der Beziehung zwischen und .TSiteγj1TLog(E(Y.ichj))

Wann sollte in der Modellformel nur etwas im Bereich für zufällige Effekte erscheinen?

Dies ist eine Frage dessen, was im Kontext der Anwendung sinnvoll ist.

In Bezug auf den Achsenabschnitt - Sie sollten den festen Achsenabschnitt aus vielen Gründen dort belassen (siehe z. B. hier ). Betreff: Der zufällige Abschnitt erster Linie eine Korrelation zwischen Beobachtungen, die an derselben Stelle gemacht wurden. Wenn eine solche Korrelation keinen Sinn ergibt, sollte der Zufallseffekt ausgeschlossen werden.γj0

In Bezug auf die zufälligen Steigungen spiegelt ein Modell mit nur zufälligen Steigungen und keinen festen Steigungen die Annahme wider, dass für jede Site eine Beziehung zwischen und Ihren Kovariaten für jede Site besteht Wenn Sie diese Effekte jedoch über alle Websites mitteln, besteht keine Beziehung. Wenn Sie beispielsweise eine zufällige Steigung in aber keine feste Steigung hatten, würde dies bedeuten, dass die Zeit im Durchschnitt keine Auswirkung hat (z. B. keine säkularen Trends in den Daten), aber jede in eine zufällige Richtung im Zeitverlauf weist. das könnte Sinn machen. Auch hier kommt es auf die Anwendung an. TLog(E(Y.ichj))TSite

Beachten Sie, dass Sie das Modell mit und ohne zufällige Effekte anpassen können, um festzustellen, ob dies der Fall ist. Im festen Modell sollten keine, im nachfolgenden Modell jedoch signifikante zufällige Effekte zu sehen sein. Ich muss Sie darauf hinweisen, dass Entscheidungen wie diese häufig besser auf der Grundlage eines Verständnisses der Anwendung als durch Modellauswahl getroffen werden.

Makro
quelle
2
(+1): Das Ausschreiben der Modellformel für jedes Modell ist in der Tat der beste Weg, um R-Notationen transparenter zu machen. Gut gemacht!
1.
@Macro Eine Frage zu den obigen Gleichungen (übrigens danke) - haben sie auch den üblichen Fehlerbegriff in sich? Wenn ja, wie lautet der Index dieses Begriffs?
Fomite
2
Hallo - eine Möglichkeit, einen GLM zu schreiben, besteht darin, wie hier beschrieben, ein Modell für (oder eine 'verknüpfte' Version) zu erstellen. Wenn das Modell korrekt angegeben ist, gibt es keine Fehlerbedingung für den erwarteten Wert. Um Ihre Frage zu beantworten, geben wir in GLMs die Verteilung von . Die "übrig gebliebene" Zufälligkeit in einem linearen Modell äußert sich in einem normalverteilten Fehlerterm. Bei nichtlinearen GLMs (z. B. Poisson, Logistik) ist jedoch eine Zufälligkeit "eingebaut", da die Kenntnis der Poisson-Rate oder der Erfolgsprobe eines Bernoulli-Versuchs keine Vorhersage einer fehlerfreien Realisierung ermöglicht. Hoffe das hilft. E(Y.ichj|X)Y.ichj|X
Makro
11

Sie sollten beachten, dass Tes sich bei keinem der Begriffe Ihres Modells um zufällige Effekte handelt, sondern um einen festen Effekt. Zufällige Effekte sind nur die Effekte, die nach dem |in einer lmerFormel erscheinen!

Eine ausführlichere Beschreibung dieser Spezifikation finden Sie in dieser früheren FAQ-Frage .

Aus diesen Fragen sollte Ihr Modell Folgendes ergeben (für Ihren festen Effekt T):

  • Ein globaler Hang
  • Ein Ausdruck mit zufälligen Steigungen, der die Abweichung von der Gesamtsteigung für jede Stufe von angibt Site
  • Die Korrelation zwischen den zufälligen Steigungen.

Und wie von @ mark999 gesagt, ist dies tatsächlich eine übliche Spezifikation. Bei Entwürfen mit wiederholten Messungen möchten Sie im Allgemeinen zufällige Steigungen und Korrelationen für alle Faktoren mit wiederholten Messungen (innerhalb von Subjekten) haben.

Im folgenden Artikel finden Sie einige Beispiele (die ich hier immer wieder zitiere):

Judd, CM, Westfall, J. & amp; Kenny, DA (2012). Stimuli als Zufallsfaktor in der Sozialpsychologie behandeln: Eine neue und umfassende Lösung für ein allgegenwärtiges, aber weitgehend ignoriertes Problem. Zeitschrift für Persönlichkeits- und Sozialpsychologie , 103 (1), 54–69. doi: 10.1037 / a0028347

Henrik
quelle
2
Eine ähnliche Referenz aus der Ökologie: Schielzeth, Holger und Wolfgang Forstmeier. 2009. „Schlussfolgerungen jenseits der Unterstützung: Überbewusste Schätzungen in gemischten Modellen.“ Behavioral Ecology 20 (2) (1. März): 416–420. doi: 10.1093 / beheco / arn145. beheco.oxfordjournals.org/content/20/2/416 .
Ben Bolker
1

Etwas sollte nur im zufälligen Teil erscheinen, wenn Sie nicht besonders an seinem Parameter interessiert sind, sondern ihn einschließen müssen, um abhängige Daten zu vermeiden. Wenn beispielsweise Kinder in Klassen verschachtelt sind, möchten Sie Kinder normalerweise nur als zufälligen Effekt.

Peter Flom - Wiedereinsetzung von Monica
quelle
1
Vielleicht verstehe ich Sie falsch, aber ich hätte gedacht, dass feste und zufällige Effekte für dieselbe Variable häufiger sind als Variablen mit nur zufälligen Effekten. Fixe und zufällige Effekte für dieselbe Variable sind im Buch von Pinheiro und Bates keine Seltenheit.
mark999
2
@MichaelChernick wie ich es verstehe, wenn Sie einen festen Effekt und einen zufälligen Effekt für dieselbe Variable haben, dann ist der feste Effekt der Gesamteffekt in der Population, während der zufällige Effekt einen unterschiedlichen Effekt der Variablen für jedes Thema ermöglicht. Es gibt mehrere Beispiele in Pinheiro & Bates.
mark999
2
@PeterFlom, re: "Wenn Kinder in Klassen verschachtelt sind, möchten Sie Kinder normalerweise nur als zufälligen Effekt." Ich denke du meinst, dass Klasse der zufällige Effekt ist. Sofern die Daten keine weiteren Verschachtelungen enthalten (z. B. wiederholte Messungen an Kindern), werden zufällige Auswirkungen auf Kinderebene nicht identifiziert.
Makro
1
@macro Ja, das habe ich gemeint, sorry. Die Terminologie wird sehr verwirrend! Das könnte der Grund sein, warum Gelman die Begriffe "fest" und "zufällig" meidet
Peter Flom - Monica wieder einsetzen
2
@Michael, ich stimme dir zu. Bei diesen Arten von hierarchischen Modellen werden die Zufallseffekte durch eine Gruppierungsvariable definiert (im Gegensatz zu anderen multivariaten Modellen wie z. B. räumlich indizierten Datensätzen, bei denen sich die Gruppierungsvariable kontinuierlich ändert). In der Frage des OP Sitewürde man von dem zufälligen Effekt sprechen, nicht von Toder Aoder irgendetwas anderem. Wenn man es so betrachtet, kann Siteder Effekt eindeutig nicht sowohl fest als auch zufällig sein, da die beiden nicht voneinander identifiziert werden können. Sie können für eine Variable sowohl feste als auch zufällige Koeffizienten festlegen, aber das ist eine andere Frage.
Makro