Kontext :
Stellen Sie sich vor, Sie hätten eine Längsschnittstudie durchgeführt, in der einmal wöchentlich über 20 Wochen eine abhängige Variable (DV) bei 200 Teilnehmern gemessen wurde. Obwohl ich an allgemeinen DVs interessiert bin, umfassen typische DVs, an die ich denke, die Arbeitsleistung nach der Einstellung oder verschiedene Wohlfühlmaßnahmen nach einer klinisch-psychologischen Intervention.
Ich weiß, dass Mehrebenenmodellierung verwendet werden kann, um die Beziehung zwischen Zeit und DV zu modellieren. Sie können auch zulassen, dass Koeffizienten (z. B. Abschnitte, Steigungen usw.) zwischen Personen variieren, und die bestimmten Werte für die Teilnehmer schätzen. Was aber, wenn Sie bei der visuellen Prüfung der Daten feststellen, dass die Beziehung zwischen Zeit und DV eine der folgenden ist:
- in funktionaler Form unterschiedlich (einige sind möglicherweise linear und andere exponentiell oder haben eine Diskontinuität)
- Unterschiedliche Fehlervarianz (einige Personen sind von einem Zeitpunkt zum nächsten volatiler)
Fragen :
- Was wäre ein guter Ansatz, um solche Daten zu modellieren?
- Welche Ansätze eignen sich insbesondere, um verschiedene Arten von Beziehungen zu identifizieren und Personen nach ihrem Typ zu kategorisieren?
- Welche Implementierungen gibt es in R für solche Analysen?
- Gibt es Hinweise dazu: Lehrbuch oder aktuelle Bewerbung?
quelle
Ich würde empfehlen, sich ein paar Artikel von Heping Zhang anzusehen, in denen adaptive Splines zur Modellierung von Längsschnittdaten verwendet werden:
Auf der MASAL- Seite finden Sie außerdem Informationen zu Software, die ein R-Paket enthält.
quelle
Mir scheint, dass Wachstumsmischungsmodelle möglicherweise die Möglichkeit bieten, Ihre Fehlervarianz zu untersuchen. ( PDF hier). (Ich bin nicht sicher, was multiplikative heteroskedastische Modelle sind, aber ich muss sie auf jeden Fall überprüfen).
Latente gruppenbasierte Trajektorienmodelle sind in letzter Zeit in der Kriminologie sehr populär geworden. Viele Menschen gehen jedoch davon aus, dass es tatsächlich Gruppen gibt, und einige kluge Nachforschungen haben ergeben, dass Sie Gruppen auch in zufälligen Daten finden. Auch zu beachten, dass Nagins gruppenbasierter Modellierungsansatz es Ihnen nicht ermöglicht, Ihren Fehler zu bewerten (und ehrlich gesagt habe ich noch nie ein Modell gesehen, das so etwas wie eine Diskontinuität aussehen würde).
Obwohl es mit 20 Zeitpunkten schwierig wäre, könnte es für Erkundungszwecke hilfreich sein, einfache Heuristiken zur Identifizierung von Mustern zu erstellen (z. B. immer niedrig oder immer hoch, Variationskoeffizient). Ich stelle mir Sparklines in einem Arbeitsblatt oder in Parallelkoordinatendiagrammen vor, aber ich bezweifle, dass sie hilfreich sind (ich habe ehrlich gesagt noch nie ein Parallelkoordinatendiagramm gesehen, das sehr aufschlussreich ist).
Viel Glück
quelle
Vier Jahre nachdem ich diese Frage gestellt habe, habe ich ein paar Dinge gelernt, also sollte ich vielleicht ein paar Ideen hinzufügen.
Ich denke, die Bayes'sche hierarchische Modellierung bietet einen flexiblen Ansatz für dieses Problem.
Software : Tools wie Jags, Stan, WinBugs usw., die möglicherweise mit ihren jeweiligen R-Schnittstellenpaketen (z. B. rjags, rstan) kombiniert sind, erleichtern die Angabe solcher Modelle.
Variieren innerhalb von Personenfehlern: Mithilfe von Bayes-Modellen kann die Abweichung innerhalb von Personenfehlern auf einfache Weise als zufälliger Faktor angegeben werden, der zwischen den Personen variiert.
Somit könnte die Standardabweichung jeder Person als Gammaverteilung modelliert werden. Ich habe festgestellt, dass dies ein wichtiger Parameter in vielen psychologischen Bereichen ist, in denen sich die Menschen im Laufe der Zeit stark unterscheiden.
Latente Kurvenklassen: Ich habe diese Idee noch nicht genau untersucht, aber es ist relativ einfach, zwei oder mehr mögliche Datenerzeugungsfunktionen für jede Person anzugeben und dann das Bayes'sche Modell das wahrscheinlichste Modell für eine bestimmte Person auswählen zu lassen. Auf diese Weise erhalten Sie in der Regel für jede Person hintere Wahrscheinlichkeiten, in welcher funktionalen Form die Personendaten beschrieben werden.
Als Skizze einer Idee für ein Modell könnten Sie Folgendes haben:
Wherexij is time and λ(1)ij represents expected values for a three parameter exponential model and λ(2)ij represents expected values for a quadratic model. πi represents the probability that model will choose λ(1)ij .
quelle
John Fox has a great appendix available on-line using nlme to look at longitudinal data. It may be useful for you:
http://cran.r-project.org/doc/contrib/Fox-Companion/appendix-mixed-models.pdf
There's a lot of great stuff there (and Fox' books are generally quite good!).
quelle