Was ist der Unterschied zwischen einem MIMIC-Faktor und einem Composite mit Indikatoren (SEM)?

10

Bei der Modellierung von Strukturgleichungen mit latenten Variablen (SEM) lautet die gängige Modellformulierung "Multiple Indicator, Multiple Cause" (MIMIC), wobei eine latente Variable durch einige Variablen verursacht und von anderen reflektiert wird. Hier ist ein einfaches Beispiel: Geben Sie hier die Bildbeschreibung ein

Im Wesentlichen f1ist ein Ergebnis für Regressions x1, x2und x3, und y1, y2und y3sind für die Messung Indikatoren f1.

Man kann auch eine zusammengesetzte latente Variable definieren, wobei die latente Variable im Wesentlichen eine gewichtete Kombination ihrer konstituierenden Variablen darstellt.

Hier ist meine Frage: Gibt es einen Unterschied zwischen der Definition f1als Regressionsergebnis und der Definition als zusammengesetztes Ergebnis in einem MIMIC-Modell?

Einige Tests mit lavaanSoftware in Rzeigen, dass die Koeffizienten identisch sind:

library(lavaan)

# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))

# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
    f1 =~ y1 + y2 + y3
    f1 ~ x1 + x2 + x3
'

# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
    f1 =~ y1 + y2 + y3
    f1 <~ x1 + x2 + x3
'

# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)

# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"

Wie sind diese beiden Modelle mathematisch gleich? Mein Verständnis ist, dass Regressionsformeln in einem SEM sich grundlegend von zusammengesetzten Formeln unterscheiden, aber dieser Befund scheint diese Idee abzulehnen. Darüber hinaus ist es einfach, ein Modell zu erstellen, bei dem der ~Operator nicht mit dem <~Operator austauschbar ist (um die lavaanSyntax zu verwenden). Normalerweise führt die Verwendung einer anstelle der anderen zu einem Modellidentifizierungsproblem, insbesondere wenn die latente Variable dann in einer anderen Regressionsformel verwendet wird. Wann sind sie austauschbar und wann nicht?

Rex Klines Lehrbuch (Prinzipien und Praxis der Strukturgleichungsmodellierung) spricht tendenziell über MIMIC-Modelle mit der Terminologie von Verbundwerkstoffen, aber Yves Rosseel, der Autor von lavaan, verwendet den Regressionsoperator in jedem MIMIC-Beispiel, das ich gesehen habe, explizit.

Kann jemand dieses Problem klären?

dmp
quelle

Antworten:

9

Sie sind das gleiche Modell.

Es ist nützlich, eine latente Variable als zusammengesetztes Ergebnis definieren zu können, wenn diese Variable nur zusammengesetzte Indikatoren enthält.

Wenn Sie nicht haben:

f1 =~ y1 + y2 + y3

Sie können nicht sagen:

f1 ~ x1 + x2 + x3

Aber Sie können haben:

f1 <~ x1 + x2 + x3
Jeremy Miles
quelle
Vielen Dank! Könnten Sie vielleicht klären, warum Sie nicht haben können f1 ~ x1 + x2 + x3, aber Sie können haben f1 <~ x1 + x2 + x3?
dmp
1
Da f1 in erster Linie noch keine Variable im Modell ist, müssen Sie es definieren, da es latent ist.
Jeremy Miles
1
Wenn Sie ein solches Modell hatten, mussten Sie einen Trick wie f1 = ~ 0 * x1 verwenden, damit Sie eine latente Variable haben, die Sie dann in f ~ x1 + x2 + x3 verwenden können.
Jeremy Miles