Ich und ich im Vergleich

Ich habe mich gefragt, ob mich jemand über die aktuellen Unterschiede zwischen diesen beiden Funktionen aufklären könnte. Ich fand die folgende Frage: Wie wähle ich die Bibliothek nlme oder lme4 R für Modelle mit gemischten Effekten? , aber das stammt aus ein paar Jahren. Das ist ein Leben lang in Softwarekreisen.

Meine spezifischen Fragen sind:

Gibt es (noch) Korrelationsstrukturen lme, lmerdie nicht funktionieren?
Ist es möglich / empfohlen, lmerfür Paneldaten zu verwenden?

Entschuldigung, wenn diese etwas grundlegend sind.

Ein bisschen detaillierter: Bei Paneldaten werden mehrere Messungen an denselben Personen zu verschiedenen Zeitpunkten durchgeführt. Ich arbeite in der Regel in einem Geschäftskontext, in dem Sie möglicherweise über mehrere Jahre Daten für Stamm- / Langzeitkunden haben. Wir möchten zeitliche Schwankungen berücksichtigen, aber die eindeutige Anpassung einer Dummy-Variablen für jeden Monat oder jedes Jahr ist ineffizient. Ich bin mir jedoch nicht sicher, ob dies lmerdas geeignete Werkzeug für diese Art von Daten ist oder ob ich die Autokorrelationsstrukturen benötige, die es lmegibt.

r mixed-model lme4-nlme Hong Ooi
quelle

Diese Antwort ist immer noch aktuell. lmerbehandelt immer noch nicht die Vielfalt der Korrelations- und Varianzstrukturen, die dies lmetut, und wie ich die Situation verstehe, wird es dies wahrscheinlich niemals tun.

Aaron - Reinstate Monica

@ Aaron Danke für die Antwort. Beeinträchtigt dies im zweiten Teil die lmerFähigkeit, mit Panel-Datasets umzugehen? Oder kann ich entkommen, ohne bestimmte Korrelationsannahmen zu treffen?

Hong Ooi

@Aaron, ich weiß ja nicht , „wird nie“ Griff korr / var Strukturen - I in das Hinzufügen dieser Funktionen interessiert bin und glaube nicht , es wäre das schwierig - aber ich würde auf jeden Fall „ , sagen nicht halten Sie Ihren Atem". Ich kenne die Paneldaten nicht gut genug, um zu wissen, wofür sie benötigt lmerwerden ... Hong, können Sie der Frage, die die erforderlichen statistischen Eigenschaften ausführlicher beschreibt, eine kurze Erklärung hinzufügen oder Hinweise geben?

Ben Bolker

@BenBolker Einige Details hinzugefügt.

Hong Ooi

Ich würde sagen, lmerwäre ziemlich gut mit einem zufälligen Effekt des Jahres und einem zufälligen Effekt des Kunden (nehmen wir an, Sie haben nur eine Messung pro Kunde und Jahr); Wenn Sie einen allgemeinen Zeittrend (mit festem Effekt) haben, sollten Sie auch eine zufällige Interaktion zwischen den Kunden (dh zufällige Steigungen) berücksichtigen. Idealerweise möchten Sie auch eine zeitliche Autokorrelation innerhalb der Zeitreihen jedes Kunden zulassen, was derzeit bei lmer nicht möglich ist. Sie können jedoch die zeitliche Autokorrelationsfunktion überprüfen, um festzustellen, ob dies wichtig ist ...

Ben Bolker,

Antworten:

UPDATE JUNI 2016:

In Bens Blog-Eintrag finden Sie Informationen zu seinen aktuellen Überlegungen dazu in lme4: Braindump, 1. Juni 2016

Wenn Sie Bayes'sche Methoden bevorzugen, unterstützt das brmsPaket brmeinige Korrelationsstrukturen: CRAN brms page . (Beachten Sie insbesondere: "Ab Version 0.6.0 von brms bezieht sich die AR-Struktur auf autoregressive Effekte von Residuen, die mit der Benennung und Implementierung in anderen Paketen wie nlme übereinstimmen. Früher bezog sich der AR-Begriff in brms auf autoregressive Effekte der Antwort. Letztere heißen jetzt ARR-Effekte und können mit dem Argument r in den Funktionen cor_arma und cor_arr modelliert werden. ")

ORIGINAL ANTWORT JULI 2013:

(Aus einem Kommentar konvertiert.)

Ich würde sagen, lmerwäre ziemlich gut mit einem zufälligen Effekt des Jahres und einem zufälligen Effekt des Kunden (nehmen wir an, Sie haben nur eine Messung pro Kunde und Jahr);

lmer(y~1 + (1|year) + (1|customer), ...)

würde für das (nur abfangen) Modell passen

Y_{i j} \sim Normal (a + ϵ_{year, i} + ϵ_{customer, j}, σ_{0}^{2})

$Y_{ij} \sim \text{Normal}(a + \epsilon_{\text{year},i} + \epsilon_{\text{customer},j}, \sigma^2_0)$

ϵ_{year}

$\epsilon_{\text{year}}$

ϵ_{customer}

$\epsilon_{\text{customer}}$

Dies ist ein ziemlich langweiliges Modell. Vielleicht möchten Sie einen allgemeinen Zeittrend (mit festem Effekt) hinzufügen und auch eine zufällige Interaktion zwischen Kunden (dh zufällige Steigungen) berücksichtigen. Ich glaube

lmer(y~year + (1|year) + (year|customer), ...)

Y_{i j} \sim Normal ((a + ϵ_{customer, j}) + (b + ϵ_{year \times customer, j}) \cdot year + ϵ_{year, i}, σ_{0}^{2})

$Y_{ij} \sim \text{Normal}((a + \epsilon_{\text{customer},j}) + (b + \epsilon_{\text{year} \times \text{customer},j}) \cdot \text{year} + \epsilon_{\text{year},i}, \sigma^2_0)$

(Die Verwendung yearauf diese Weise stellt eine Ausnahme von der üblichen Regel dar, dass eine Eingabevariable nicht sowohl als angepasster als auch als zufälliger Effekt im selben Modell enthalten ist. Sofern es sich um eine numerische Variable handelt, yearwird sie im festen Effekt und im year:customer(zufälligen) Effekt als stetig behandelt. Interaktion und als kategorisch im Zufallseffekt ...)

Natürlich möchten Sie möglicherweise Kovariaten auf Jahres-, Kunden- und Beobachtungsebene hinzufügen, die einen Teil der relevanten Varianz aufsaugen (z. B. einen durchschnittlichen Verbraucherpreisindex hinzufügen, um zu erklären, warum Jahre schlecht oder gut waren ...).

Idealerweise möchten Sie auch eine zeitliche Autokorrelation innerhalb der Zeitreihen jedes Kunden zulassen, was derzeit nicht möglich lmerist. Sie können jedoch die zeitliche Autokorrelationsfunktion überprüfen, um festzustellen, ob dies wichtig ist.

Einschränkung : Ich weiß nicht so viel über Standardansätze für den Umgang mit Paneldaten. Dies basiert nur auf meinem Wissen über gemischte Modelle. Kommentatoren (oder Redakteure) sollten sich frei fühlen, wenn dies gegen die Standards / Best Practices in der Ökonometrie zu verstoßen scheint.

Ben Bolker
quelle

X \sim N (μ, σ^{2})

$X \sim N(\mu, \sigma^2)$

X

$X$

μ

$\mu$

σ^{2}

$\sigma^2$

Y_{i j}

$Y_{ij}$

N (a, σ_{0}^{2} + σ_{y e a r}^{2} + σ_{c u s t}^{2})

$N(a,\sigma^{2}_0 + \sigma^{2}_{year} + \sigma^{2}_{cust})$

a + b \cdot y e a r

$a+b \cdot {\rm year}$

Ja, danke Ben. In der Praxis würde es ebenfalls feste Auswirkungen geben, z. B. Alter, Geschlecht und alle üblichen Verdächtigen. @Macro: Ben hat es richtig, glaube ich.

Hong Ooi

μ

$\mu$

Y \sim Normal (X β + Z u, σ^{2}); u \sim MVNormal (0, Σ); Σ = f (θ)

$Y \sim \text{Normal}(X \beta + Z u, \sigma^2); u \sim \text{MVNormal}(0,\Sigma); \Sigma=f(\theta)$

@BenBolker: Ist dir aufgefallen, dass ich für diese Frage ein Kopfgeld gesetzt habe, weil ich nach einem möglichen Update suche ?

S. Kolassa - Wiedereinsetzung von Monica

Ich habe gerade unter rawgit.com/bbolker/mixedmodels-misc/master/notes/… ein paar Sachen gepostet, an denen ich in letzter Zeit gearbeitet habe . Ich werde versuchen, relevante Punkte in meine Antwort einzubeziehen (alternativ kann jeder andere seine eigene Antwort auf der Grundlage dieser Informationen veröffentlichen oder meine Frage bearbeiten!)

Ben Bolker,

Um Ihre Fragen direkt zu beantworten, und NB das ist Jahre nach dem ursprünglichen Beitrag!

Ja, es gibt immer noch Korrelationsstrukturen, die von nlme verarbeitet werden und von lme4 nicht verarbeitet werden. Dies ist jedoch der Fall, solange nlme es dem Benutzer ermöglicht, allgemeine corstrs zu definieren, und lme4 nicht. Dies hat überraschend wenig praktische Auswirkungen. Die "Big Three" -Korrelationsstrukturen von: Independent, Exchangeable und AR-1-Korrelationsstrukturen werden von beiden Paketen einfach gehandhabt.
Das ist durchaus möglich . Sie können auch Paneldaten mit der lmFunktion ausstatten! Meine Empfehlung, welche ich verwenden soll, hängt vom Problem ab. lme4ist ein viel kleineres Toolkit, und die Formeldarstellung ist eine übersichtliche Darstellung einiger sehr gebräuchlicher Modelle mit gemischten Effekten. nlmeist ein sehr großer Werkzeugkasten, in dem Sie mit einem WIG-Schweißgerät alle Werkzeuge herstellen können, die Sie benötigen.

Sie sagen, Sie möchten "zeitliche Schwankungen" berücksichtigen. Im Wesentlichen wird dies durch eine austauschbare Korrelationsstruktur erreicht, die ein zufälliges Abfangen in jedem Cluster ermöglicht, sodass die Intracluster-Varianz die Summe der Variationen auf Cluster-Ebene sowie der (von Ihnen genannten) Variationen über die Zeit ist. Dies hält Sie keineswegs davon ab, feste Effekte zu verwenden, um genauere Vorhersagen über die Zeit zu erhalten.

AdamO
quelle

Hmm. Wie kann man die AR-1-Korrelation in lme4 verwenden?

Amöbe sagt Reinstate Monica