Ich habe mich gefragt, ob mich jemand über die aktuellen Unterschiede zwischen diesen beiden Funktionen aufklären könnte. Ich fand die folgende Frage: Wie wähle ich die Bibliothek nlme oder lme4 R für Modelle mit gemischten Effekten? , aber das stammt aus ein paar Jahren. Das ist ein Leben lang in Softwarekreisen.
Meine spezifischen Fragen sind:
- Gibt es (noch) Korrelationsstrukturen
lme
,lmer
die nicht funktionieren? - Ist es möglich / empfohlen,
lmer
für Paneldaten zu verwenden?
Entschuldigung, wenn diese etwas grundlegend sind.
Ein bisschen detaillierter: Bei Paneldaten werden mehrere Messungen an denselben Personen zu verschiedenen Zeitpunkten durchgeführt. Ich arbeite in der Regel in einem Geschäftskontext, in dem Sie möglicherweise über mehrere Jahre Daten für Stamm- / Langzeitkunden haben. Wir möchten zeitliche Schwankungen berücksichtigen, aber die eindeutige Anpassung einer Dummy-Variablen für jeden Monat oder jedes Jahr ist ineffizient. Ich bin mir jedoch nicht sicher, ob dies lmer
das geeignete Werkzeug für diese Art von Daten ist oder ob ich die Autokorrelationsstrukturen benötige, die es lme
gibt.
quelle
lmer
behandelt immer noch nicht die Vielfalt der Korrelations- und Varianzstrukturen, die dieslme
tut, und wie ich die Situation verstehe, wird es dies wahrscheinlich niemals tun.lmer
Fähigkeit, mit Panel-Datasets umzugehen? Oder kann ich entkommen, ohne bestimmte Korrelationsannahmen zu treffen?lmer
werden ... Hong, können Sie der Frage, die die erforderlichen statistischen Eigenschaften ausführlicher beschreibt, eine kurze Erklärung hinzufügen oder Hinweise geben?lmer
wäre ziemlich gut mit einem zufälligen Effekt des Jahres und einem zufälligen Effekt des Kunden (nehmen wir an, Sie haben nur eine Messung pro Kunde und Jahr); Wenn Sie einen allgemeinen Zeittrend (mit festem Effekt) haben, sollten Sie auch eine zufällige Interaktion zwischen den Kunden (dh zufällige Steigungen) berücksichtigen. Idealerweise möchten Sie auch eine zeitliche Autokorrelation innerhalb der Zeitreihen jedes Kunden zulassen, was derzeit bei lmer nicht möglich ist. Sie können jedoch die zeitliche Autokorrelationsfunktion überprüfen, um festzustellen, ob dies wichtig ist ...Antworten:
UPDATE JUNI 2016:
In Bens Blog-Eintrag finden Sie Informationen zu seinen aktuellen Überlegungen dazu in
lme4
: Braindump, 1. Juni 2016Wenn Sie Bayes'sche Methoden bevorzugen, unterstützt das
brms
Paketbrm
einige Korrelationsstrukturen: CRAN brms page . (Beachten Sie insbesondere: "Ab Version 0.6.0 von brms bezieht sich die AR-Struktur auf autoregressive Effekte von Residuen, die mit der Benennung und Implementierung in anderen Paketen wie nlme übereinstimmen. Früher bezog sich der AR-Begriff in brms auf autoregressive Effekte der Antwort. Letztere heißen jetzt ARR-Effekte und können mit dem Argument r in den Funktionen cor_arma und cor_arr modelliert werden. ")ORIGINAL ANTWORT JULI 2013:
(Aus einem Kommentar konvertiert.)
Ich würde sagen,
lmer
wäre ziemlich gut mit einem zufälligen Effekt des Jahres und einem zufälligen Effekt des Kunden (nehmen wir an, Sie haben nur eine Messung pro Kunde und Jahr);würde für das (nur abfangen) Modell passen
Dies ist ein ziemlich langweiliges Modell. Vielleicht möchten Sie einen allgemeinen Zeittrend (mit festem Effekt) hinzufügen und auch eine zufällige Interaktion zwischen Kunden (dh zufällige Steigungen) berücksichtigen. Ich glaube
(Die Verwendung
year
auf diese Weise stellt eine Ausnahme von der üblichen Regel dar, dass eine Eingabevariable nicht sowohl als angepasster als auch als zufälliger Effekt im selben Modell enthalten ist. Sofern es sich um eine numerische Variable handelt,year
wird sie im festen Effekt und imyear:customer
(zufälligen) Effekt als stetig behandelt. Interaktion und als kategorisch im Zufallseffekt ...)Natürlich möchten Sie möglicherweise Kovariaten auf Jahres-, Kunden- und Beobachtungsebene hinzufügen, die einen Teil der relevanten Varianz aufsaugen (z. B. einen durchschnittlichen Verbraucherpreisindex hinzufügen, um zu erklären, warum Jahre schlecht oder gut waren ...).
Idealerweise möchten Sie auch eine zeitliche Autokorrelation innerhalb der Zeitreihen jedes Kunden zulassen, was derzeit nicht möglich
lmer
ist. Sie können jedoch die zeitliche Autokorrelationsfunktion überprüfen, um festzustellen, ob dies wichtig ist.Einschränkung : Ich weiß nicht so viel über Standardansätze für den Umgang mit Paneldaten. Dies basiert nur auf meinem Wissen über gemischte Modelle. Kommentatoren (oder Redakteure) sollten sich frei fühlen, wenn dies gegen die Standards / Best Practices in der Ökonometrie zu verstoßen scheint.
quelle
Um Ihre Fragen direkt zu beantworten, und NB das ist Jahre nach dem ursprünglichen Beitrag!
Ja, es gibt immer noch Korrelationsstrukturen, die von nlme verarbeitet werden und von lme4 nicht verarbeitet werden. Dies ist jedoch der Fall, solange nlme es dem Benutzer ermöglicht, allgemeine corstrs zu definieren, und lme4 nicht. Dies hat überraschend wenig praktische Auswirkungen. Die "Big Three" -Korrelationsstrukturen von: Independent, Exchangeable und AR-1-Korrelationsstrukturen werden von beiden Paketen einfach gehandhabt.
Das ist durchaus möglich . Sie können auch Paneldaten mit der
lm
Funktion ausstatten! Meine Empfehlung, welche ich verwenden soll, hängt vom Problem ab.lme4
ist ein viel kleineres Toolkit, und die Formeldarstellung ist eine übersichtliche Darstellung einiger sehr gebräuchlicher Modelle mit gemischten Effekten.nlme
ist ein sehr großer Werkzeugkasten, in dem Sie mit einem WIG-Schweißgerät alle Werkzeuge herstellen können, die Sie benötigen.Sie sagen, Sie möchten "zeitliche Schwankungen" berücksichtigen. Im Wesentlichen wird dies durch eine austauschbare Korrelationsstruktur erreicht, die ein zufälliges Abfangen in jedem Cluster ermöglicht, sodass die Intracluster-Varianz die Summe der Variationen auf Cluster-Ebene sowie der (von Ihnen genannten) Variationen über die Zeit ist. Dies hält Sie keineswegs davon ab, feste Effekte zu verwenden, um genauere Vorhersagen über die Zeit zu erhalten.
quelle