Item Response Theory vs. Confirmatory Factor Analysis

14

Ich habe mich gefragt, was die wichtigsten, bedeutungsvollen Unterschiede zwischen der Item-Response-Theorie und der Bestätigungsfaktor-Analyse sind.

Ich verstehe, dass es Unterschiede in den Berechnungen gibt (der Schwerpunkt liegt eher auf Item vs. Covariances; log-linear vs. linear).

Ich habe jedoch keine Ahnung, was dies aus einer übergeordneten Perspektive bedeutet. Bedeutet dies, dass IRT unter bestimmten Umständen besser ist als CFA? Oder für etwas andere Zwecke?

Überlegungen wären nützlich, da ein Scan der Forschungsliteratur eher zu einer Beschreibung von IRT und CFA als zu einem nützlichen Vergleich der Kernunterschiede zwischen ihnen führte.

SimonsSchus
quelle

Antworten:

7

@Philchalmers Antwort ist auf den Punkt, und wenn Sie eine Referenz von einem der führenden Unternehmen auf dem Gebiet, Muthen (Schöpfer von Mplus), wollen, gehen Sie hier: (Bearbeitet, um direktes Zitat aufzunehmen)

Ein MPlus-Benutzer fragt: Ich versuche, aktuelle Ähnlichkeiten und Unterschiede zwischen binärem CFA und IRT für meine Dissertation zu beschreiben und zu veranschaulichen. Die Standardschätzungsmethode in Mplus für kategoriale CFA ist WLSMV. Um ein IRT-Modell auszuführen, wird im Beispiel in Ihrem Handbuch empfohlen, MLR als Schätzmethode zu verwenden. Wenn ich MLR verwende, ist die Dateneingabe immer noch die tetrachorische Korrelationsmatrix oder wird die ursprüngliche Antwortdatenmatrix verwendet?

Bengt Muthen antwortet: Ich glaube nicht, dass es einen Unterschied zwischen CFA von kategorialen Variablen und IRT gibt. Es wird manchmal behauptet, aber ich stimme nicht zu. Welcher Schätzer normalerweise verwendet wird, kann variieren, ist aber nicht unbedingt erforderlich. MLR verwendet die Rohdaten und keine tetrachorische Korrelationsmatrix. ... Der ML (R) -Ansatz ist derselbe wie der in zB Bocks Arbeit beschriebene "Rand-ML (MML)" -Ansatz. Verwenden Sie also die Rohdaten und integrieren Sie die Faktoren mithilfe der numerischen Integration. MML wird der "bedingten ML" gegenübergestellt, die z. B. bei Rasch-Ansätzen verwendet wird.

Unter der Annahme normaler Faktoren, probit (normal ogive) Item-Factor-Beziehungen und bedingter Unabhängigkeit sind die Annahmen für ML und für WLSMV gleich, wobei letzteres die Tetrachorie verwendet. Dies liegt daran, dass diese Annahmen der Annahme multivariater normaler zugrunde liegender kontinuierlicher latenter Antwortvariablen hinter den kategorialen Ergebnissen entsprechen. WLSMV verwendet also nur Informationen erster und zweiter Ordnung, während ML bis zur höchsten Ordnung reicht. Der Informationsverlust erscheint jedoch gering. ML passt das Modell nicht zu diesen Beispieltetrachorien, daher kann man vielleicht sagen, dass WLSMV auf andere Weise marginalisiert. Es geht eher um Schätzerunterschiede als um Modellunterschiede.

Wir haben einen IRT-Hinweis auf unserer Website:

http://www.statmodel.com/download/MplusIRT2.pdf

Aber auch hier unterscheidet sich der ML (R) -Ansatz nicht von dem, was in IRT MML verwendet wird.

Quelle: http://www.statmodel.com/discussion/messages/9/10401.html?1347474605

robin.datadrivers
quelle
2
Könnten Sie vielleicht einige relevante Zitate von Muthen in Ihre Antwort kopieren und einfügen? Nur-Link-Antworten werden im Allgemeinen verpönt, insbesondere weil Links dazu neigen, zu verrotten.
Amöbe sagt Reinstate Monica
2
Ich bin mir nicht sicher, ob ich der Aussage von Muthen hier zustimme, da er IRT offenbar sehr eng definiert. Ja, die 2PL- und Graded-Response-Modelle können in einem SEM-Framework verstanden werden, da sie nette kanonische Verknüpfungsfunktionen haben und daher unter Verwendung anderer ausreichender Statistiken (wie polychrone Korrelationen) erneut ausgedrückt werden können. Aber was ist mit anderen allgemeineren IRT-Modellen wie dem 3PL-Modell, dem Idealpunktmodell, dem Teilkompensationsmodell usw.? Sicher, einige Modelle können in einem SEM-Framework verstanden werden, aber ich denke, mein Standpunkt zu IRT steht noch.
Philchalmers
17

In gewisser Hinsicht haben Sie Recht, CFA und IRT werden aus dem gleichen Stoff geschnitten. Aber in vielerlei Hinsicht sind sie auch ganz anders. CFA oder besser gesagt Item-CFA ist eine Anpassung des Frameworks für die Strukturgleichungs- / Kovarianzmodellierung, um eine bestimmte Art der Kovariation zwischen kategorialen Elementen zu berücksichtigen. Bei IRT geht es direkter darum, kategoriale Variablenbeziehungen zu modellieren, ohne nur Informationen erster und zweiter Ordnung in den Variablen zu verwenden (es handelt sich um vollständige Informationen, sodass die Anforderungen im Allgemeinen nicht so streng sind).

Item CFA hat mehrere Vorteile, da es in das SEM-Framework fällt und daher sehr weitreichend auf multivariate Beziehungssysteme zu anderen Variablen anwendbar ist. Das IRT konzentriert sich dagegen in erster Linie auf den Test selbst, es können aber auch Kovariaten direkt in den Test einbezogen werden (siehe z. B. Themen zur erklärenden IRT). Ich habe auch festgestellt, dass Elementmodellierungsbeziehungen im IRT-Framework weitaus allgemeiner sind, da nicht-monotone, nicht-parametrische oder einfach angepasste Elementantwortmodelle einfacher zu handhaben sind, da man sich keine Sorgen um die Hinlänglichkeit machen muss der Verwendung der polychronen Korrelationsmatrix.

Beide Frameworks haben ihre Vor- und Nachteile, aber im Allgemeinen ist die CFA flexibler, wenn sich die Ebene der Modellabstraktion / -inferenz auf die Beziehung innerhalb eines Variablensystems konzentriert, während die IRT im Allgemeinen bevorzugt wird, wenn der Test selbst (und die darin enthaltenen Elemente) im Mittelpunkt des Interesses.

Philchalmers
quelle
Wunderbar - das ist eine schöne und klare Übersicht. Vielen Dank, Phil.
SimonsSchus
2
Dies sollte die akzeptierte Antwort sein.
Vladislavs Dovgalecs
2

Ich glaube, Yves Rosseel diskutiert es kurz in den Folien 91-93 seines Workshops 2014: http://www.personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf

Aus Rosseel (2014, Link oben):

Vollständiger Informationsansatz: marginale maximale Wahrscheinlichkeit

Herkunft: IRT-Modelle (zB Bock & Lieberman, 1970) und GLMMs

...

die Verbindung mit IRT

• Die theoretische Beziehung zwischen SEM und IRT ist gut dokumentiert:

Takane, Y. & De Leeuw, J. (1987). Zum Zusammenhang zwischen Item-Response-Theorie und Faktoranalyse diskretisierter Variablen. Psychometrika, 52, 393-408.

Kamata, A. & Bauer, DJ (2008). Eine Anmerkung zur Beziehung zwischen faktoranalytischen und Item-Response-Theorie-Modellen. Structural Equation Modeling, 15, 136-153.

Joreskog, KG & Moustaki, I. (2001). Faktorenanalyse von Ordinalvariablen: Ein Vergleich von drei Ansätzen. Multivariate Behavioral Research, 36, 347 & ndash; 387.

wann sind sie gleichwertig

• probit (normal-ogive) versus logit: Beide Metriken werden in der Praxis verwendet

• Ein Ein-Faktor-CFA für binäre Elemente entspricht einem 2-Parameter-IRT-Modell (Birnbaum, 1968):

In CFA: ... In IRT: ... (siehe Folie)

• Ein CFA mit einem einzelnen Faktor für polychotome (ordinale) Elemente entspricht dem abgestuften Reaktionsmodell (Samejima, 1969).

• Es gibt kein CFA-Äquivalent für das 3-Parameter-Modell (mit einem Schätzparameter)

• Das Rasch-Modell entspricht einem Einzelfaktor-CFA für binäre Elemente, wobei jedoch alle Faktorladungen gleich sein müssen (und die Probit-Metrik in eine Logit-Metrik konvertiert wird).

Pier-Eric Chamberland
quelle