Was wäre ein anschauliches Bild für lineare Mischmodelle?

17

Angenommen, Sie befinden sich in der Bibliothek Ihrer Statistikabteilung und stoßen auf ein Buch mit dem folgenden Bild auf der Titelseite.

Bildbeschreibung hier eingeben

Sie werden wahrscheinlich denken, dass dies ein Buch über lineare Regression ist.

Welches Bild lässt Sie über lineare Mischmodelle nachdenken?

Ocram
quelle

Antworten:

12

Für einen Vortrag habe ich das folgende Bild verwendet, das auf dem sleepstudyDatensatz aus dem Paket lme4 basiert . Die Idee bestand darin, den Unterschied zwischen unabhängigen Regressionsanpassungen aus themenspezifischen Daten (grau) und Vorhersagen aus Zufallseffektmodellen zu veranschaulichen , insbesondere, dass (1) vorhergesagte Werte aus Zufallseffektmodellen Schrumpfungsschätzer sind und dass (2) einzelne Trajektorien gemeinsam sind eine gemeinsame Neigung mit einem Zufallsschnittmodell (orange). Die Verteilungen der Subjektabschnitte werden als Kerndichteschätzungen auf der y-Achse ( R-Code ) gezeigt.

Bildbeschreibung hier eingeben
(Die Dichtekurven erstrecken sich über den Bereich der beobachteten Werte hinaus, da relativ wenige Beobachtungen vorliegen.)

Eine "konventionellere" Grafik könnte die nächste sein, die von Doug Bates stammt (verfügbar auf R-forge-Site für lme4 , z. B. 4Longitudinal.R ), wo wir in jedem Panel individuelle Daten hinzufügen könnten.

Bildbeschreibung hier eingeben

chl
quelle
+1. Guter! Ich denke, Ihre erste Handlung ist konzeptionell großartig. Mein einziger Kommentar wäre, dass es deutlich mehr Erklärungen erfordert als eine normale "naive" Handlung, und wenn das Publikum mit den Konzepten von LME-Modellen und Längsschnittdaten nicht auf dem neuesten Stand ist, könnte es den Punkt der Handlung verfehlen. Ich werde mich definitiv für ein solides "Statistikgespräch" daran erinnern. (Ich habe bereits das zweite Grundstück in dem „lme4 Buch“ ein paar Mal gesehen war ich auch nicht beeindruckt dann , und ich bin nicht zu jetzt entweder beeindruckt..)
usεr11852 sagt wieder einzusetzen Monic
@chl: Danke! Ich werde unter den Vorschlägen wählen. In der Zwischenzeit +1
ocram
@ user11852 Mein Verständnis des RI-Modells ist, dass OLS-Schätzungen korrekt sind, ihre Standardfehler jedoch nicht (aufgrund der mangelnden Unabhängigkeit), sodass auch einzelne Vorhersagen falsch sind. Normalerweise würde ich die gesamte Regressionslinie unter der Annahme unabhängiger Beobachtungen anzeigen. Die Theorie sagt uns dann, dass das Kombinieren von bedingten Modi der Zufallseffekte und Schätzungen der festen Effekte bedingte Modi der subjektinternen Koeffizienten ergibt, und dass es kaum zu einer Fehlfunktion kommt, wenn statistische Einheiten unterschiedlich sind oder wenn Messungen genau sind oder mit große Proben.
Chl
y|γN(Xβ+Zγ,σ2ich)yN(Xβ,ZDZT+σ2ich)
Die Verknüpfung zum R-Code zum Erstellen des Bildes ist unterbrochen. Mich würde interessieren, wie man die Verteilungen in der Abbildung vertikal zeichnet.
Niels Hameleers
8

Also etwas, das nicht "extrem elegant" ist, sondern zufällige Abschnitte und Steigungen mit R zeigt. (Ich denke, es wäre noch cooler, wenn die tatsächlichen Gleichungen auch gezeigt würden.) Bildbeschreibung hier eingeben

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()
usεr11852 sagt Reinstate Monic
quelle
Vielen Dank! Ich warte noch ein bisschen auf mögliche neue Antworten ... aber ich könnte darauf aufbauen.
2.
Ich bin ein bisschen verwirrt von Ihrer Figur, weil die richtige Nebenhandlung für mich so aussieht, als ob für jede Gruppe eine eigene Regressionslinie passt. Ist es nicht der springende Punkt, dass gemischte Modellanpassungen sich von unabhängigen Gruppenanpassungen unterscheiden sollten? Vielleicht sind sie es, aber in diesem Beispiel ist es wirklich schwer zu bemerken, oder vermisse ich etwas?
Amöbe sagt Reinstate Monica
2
Ja, die Koeffizienten sind unterschiedlich . Nee; Eine separate Regression war nicht für jede Gruppe geeignet. Die bedingten Anpassungen werden angezeigt. In einem perfekt ausbalancierten, homoskedastischen Design wie diesem wird der Unterschied in der Tat schwer zu bemerken sein, zum Beispiel beträgt der bedingte Achsenabschnitt der Gruppe 5 2,96, während der unabhängige Gruppenabschnitt 3,00 beträgt. Es ist die Fehlerkovarianzstruktur, die Sie ändern. Überprüfen Sie Chi Antwort auch, es hat mehr Gruppen, aber auch dort in sehr wenigen Fällen ist die Passform "viel anders" visuell.
usεr11852 sagt Reinstate Monic
6

Nicht meine Arbeit

Diese Grafik aus der Matlab-Dokumentation von nlmefit scheint mir ein gutes Beispiel für das Konzept von zufälligen Abschnitten und Steigungen zu sein. Wahrscheinlich wäre auch etwas, das Gruppen von Heteroskedastizität in den Resten eines OLS-Diagramms zeigt, ziemlich Standard, aber ich würde keine "Lösung" geben.

usεr11852 sagt Reinstate Monic
quelle
Danke für Ihren Vorschlag. Obwohl es wie gemischte logistische Regressionssachen aussieht, kann ich es leicht anpassen. Ich warte auf weitere Vorschläge. In der Zwischenzeit +1. Danke noch einmal.
2.
Es sieht nach einer gemischten logistischen Regression aus, vor allem, weil es eine ist ... :) Es war die erste Handlung, die mir wirklich in den Sinn kam! Ich werde in einer zweiten Antwort etwas rein R-isch geben.
usεr11852 sagt Reinstate Monic