Ähnlichkeiten und Unterschiede zwischen dem IRT-Modell und dem logistischen Regressionsmodell

9

Trotz der grundlegenden Ähnlichkeiten wie bei beiden Modellen ist die Erfolgswahrscheinlichkeit eher als die direkte Modellierung der Antwortvariablen; Ich glaube, dass es zuverlässigere Antworten gibt, die auf die Unterschiede und Ähnlichkeiten zwischen diesen Modellen hinweisen.

Ein Unterschied besteht darin, dass in der Logistik unterschiedliche Typen und unterschiedliche Anzahlen unabhängiger Variablen verwendet werden können. Während wir im IRT-Modell nur eine unabhängige Variable haben, nämlich die Fähigkeit.

Noch eine Ähnlichkeit: Um die Parameter in der Logistik abzuschätzen, verwenden wir den Maximum-Likelihood-Ansatz. Im IRT verwenden wir auch die marginale maximale Wahrscheinlichkeit als einen der Parameterschätzungsansätze.

Kann jemand bitte die statistischen / mathematischen Unterschiede in diesen beiden Modellen angeben?

Artiga
quelle
1
IRT (auch bekannt als Latent Trait Analysis) wird manchmal als Logistic Factor Analysis bezeichnet ( siehe ). Der Unterschied zwischen LR und IRT entspricht weitgehend dem Unterschied zwischen linearer Regression und Faktoranalyse. Bei der Regression wird eine abhängige Variable zusammen mit den unabhängigen Manifestvariablen angegeben. In der Faktoranalyse und anderen Modellen latenter Variablen wird latent aus den angegebenen Manifestvariablen extrahiert. Darüber hinaus ist es das Latente, das dann als unabhängige Variable angesehen wird, die die Manifestierten "vorhersagt".
ttnphns
@ttnphns, vielen Dank für die Antwort. Begehen Sie also einen Fehler, wenn ich eine Variable Y als Antwort auf ein Element beziehe und dann die Wahrscheinlichkeit modelliere, dass es korrekt ist. Habe ich in diesem Szenario meine abhängige Variable noch nicht gekannt? Und noch eine Frage, Manifestvariable, die Sie als abhängige Variable im IRT meinen, oder?
Artiga
Wiederholen. In einer Regression haben Sie manifestierte DVs Y und manifestierte IVs X. In latenten Variablenmodellen (Faktoranalyse, IRT, ...) haben Sie nur X. Latente Faktoren F werden aus X extrahiert, aber extrahiert, um sie zu berücksichtigen Als Prädiktoren für X dienen sie also den IVs für X, die die DVs sind. Bei der logistischen Regression ist die kategoriale DV eine logistische Funktion der linearen Kombination von (normalerweise kontinuierlichen) IVs. In der IRT sind die beobachteten kategorialen Variablen logistische Funktionen der linearen Kombination kontinuierlicher Fs.
ttnphns

Antworten:

11

Schauen Sie sich Abschnitt 1.6 ("Die lineare Regressionsperspektive") in De Boeck und Wilson (2008) Explanatory Item Response Models ( http://www.springer.com/de/book/9780387402758 ) und Formann, AK (2007) an. , (Fast) Äquivalenz zwischen bedingten und gemischten Maximum-Likelihood-Schätzungen für einige Modelle des Rasch-Typs, In M. von Davier & CH Carstensen (Hrsg.), Multivariate und Mischungsverteilungs-Rasch-Modelle (S. 177-189), New York: Springer.

Kurz gesagt: IRT-Modelle sind verallgemeinerte nichtlineare Modelle mit gemischten Effekten :

  • die Punktzahl eines Schülers p zu einem Gegenstand i ist die abhängige Variable,Y.pich{0,1}}pich
  • Bei einem zufällig ausgewählten Schülermerkmal, z. B. , wird angenommen, dass die Antworten unabhängig von Bernoulli verteilt sind.θpN.(μ,σ2)
  • gegeben , der Prädiktor η p i = logit ( P ( Y p i = 1 ) ) ist eine lineare Kombination von Punkt Eigenschaften η p i = K Σ k = 0 b k X i k + θ p + ε p i ,θpηpich=logit(P.(Y.pich=1))
    ηpich=k=0K.bkX.ichk+θp+εpich,
  • sei wenn i = k und X i k = 0 , andernfalls - so erhält man das Rasch-Modell P ( Y p i = 1 θ p ) = exp ( θ p - b i )X.ichk=- -1,ich=kX.ichk=0
    P.(Y.pich=1θp)=exp(θp- -bich)1+exp(θp- -bich);;

Beachten Sie, dass IRT-Modelle auf verschiedene Aspekte erweitert werden:

  • In Bezug auf die Unterscheidungskraft (2PL) und das Schätzverhältnis (3PL) eines Gegenstands
    P.(Y.pich=1θp)=cich+(1- -cich)exp(einich(θp- -bich))1+exp(einich(θp- -bich))
  • P.(Y.pich=kθp)=exp(einichkθp- -bichk)k=0K.exp(einichkθp- -bichk)
  • θpN.(Z.β,σ2),
  • P.(Y.pich=1θp)=exp(deinichdθpd- -bich)1+exp(deinichdθpd- -bich),θpN.d(μ,Σ)
  • P.(Y.pich=1θp(l))=exp(θp(l)- -bich(l))1+exp(θp(l)- -bich(l)),θp(l){θp(1),,θp(L.)}}

(entnommen aus den useR! 2015-Folien für das R-Paket TAM )

Tom
quelle
3
Es gibt auch frei verfügbares Papier von de Boeck et al. Auf diesem jstatsoft.org/article/view/v039i12 sowie sein Handout statmath.wu.ac.at/courses/deboeck/materials/handouts.pdf
Tim
0

@ Toms Antwort ist ausgezeichnet, aber ich möchte eine Version anbieten, die heuristischer ist und ein zusätzliches Konzept einführt.

Logistische Regression

Stellen Sie sich vor, wir haben eine Reihe von binären Fragen. Wenn wir an der Wahrscheinlichkeit interessiert sind, auf eine der Fragen mit Ja zu antworten, und wenn wir an der Auswirkung einiger unabhängiger Variablen auf diese Wahrscheinlichkeit interessiert sind, verwenden wir die logistische Regression:

P.(yich=1)=11+exp(X.β)=lÖGicht- -1(X.β)

β

IRT

Beachten Sie nun, dass ich sagte, wir hätten eine Reihe von binären Fragen. Diese Fragen könnten alle eine latente Eigenschaft haben, z. B. verbale Fähigkeiten, Grad der Depression, Grad der Extraversion. Oft interessieren wir uns für das Niveau des latenten Merkmals selbst.

βθθ

P.(yich=1)=lÖGicht- -1[einich(θj- -bich)]]

einichbich

θ

Ich habe der Einfachheit halber binäre Elemente und logistische Regression verwendet, aber der Ansatz verallgemeinert sich auf geordnete Elemente und geordnete logistische Regression.

Erklärendes IRT

β

Wie bereits erwähnt, besteht ein Modell zur Schätzung des latenten Merkmals darin, nur die Anzahl der richtigen Antworten zu zählen oder alle Werte Ihrer Likert-Elemente (dh kategorialen Elemente) zu addieren. Das hat seine Mängel; Sie gehen davon aus, dass jeder Gegenstand (oder jede Stufe jedes Gegenstands) den gleichen Betrag des latenten Merkmals wert ist. Dieser Ansatz ist in vielen Bereichen weit verbreitet.

Vielleicht können Sie sehen, wohin ich damit gehe: Sie können IRT verwenden, um das Niveau des latenten Merkmals vorherzusagen, und dann eine regelmäßige lineare Regression durchführen. Das würde jedoch die Unsicherheit in der latenten Eigenschaft jeder Person ignorieren.

θθ

Weitere Informationen finden Sie in Phil Chalmers 'ausgezeichnetem Intro zu seinem mirtPaket. Wenn Sie die Schrauben und Muttern von IRT verstehen, gehe ich zum Abschnitt Mixed Effects IRT dieser Folien . Stata ist auch in der Lage, erklärende IRT-Modelle anzupassen (obwohl ich glaube, dass es nicht zu erklärenden IRT-Modellen mit zufälligen Effekten passen kann, wie ich oben beschrieben habe).

Weiwen Ng
quelle