Ich habe Gegenstände aus psychometrischer Sicht analysiert. Aber jetzt versuche ich, andere Arten von Fragen zu Motivation und anderen Themen zu analysieren. Diese Fragen beziehen sich alle auf Likert-Skalen. Mein erster Gedanke war, die Faktorenanalyse zu verwenden, da angenommen wird, dass die Fragen einige zugrunde liegende Dimensionen widerspiegeln.
- Aber ist eine Faktorenanalyse angebracht?
- Ist es notwendig, jede Frage hinsichtlich ihrer Dimensionalität zu validieren?
- Gibt es ein Problem bei der Durchführung von Faktorenanalysen für Likert-Artikel?
- Gibt es gute Papiere und Methoden zur Durchführung von Faktorenanalysen zu Likert und anderen kategorialen Elementen?
Antworten:
Nach dem, was ich bisher gesehen habe, wird FA für Einstellungselemente verwendet, ebenso wie für andere Arten von Bewertungsskalen. Das Problem, das sich aus der verwendeten Metrik ergibt (d. H. "Sind Likert-Skalen wirklich als numerische Skalen zu behandeln?"), Besteht seit langem. Wenn Sie jedoch die glockenförmige Antwortverteilung überprüfen, können Sie diese als kontinuierliche Messungen behandeln. andernfalls kann die Prüfung auf nichtlineare FA-Modelle oder optimale Skalierung von polytmomen IRT-Modellen wie dem Graded Response-, Rating Scale- oder Partial Credit-Modell durchgeführt werden. Die beiden letzteren können verwendet werden, um grob zu überprüfen, ob die Schwellenabstände, wie sie in Likert-artigen Elementen verwendet werden, ein Merkmal des Antwortformats (RSM) oder des bestimmten Elements (PCM) sind.
In Bezug auf Ihren zweiten Punkt ist beispielsweise bekannt, dass sich die Antwortverteilungen in Einstellungs - oder Gesundheitsumfragen von Land zu Land unterscheiden (z. B. heben die Chinesen im Vergleich zu denen aus westlichen Ländern tendenziell "extreme" Antwortmuster hervor, siehe z. B. Song , X.-Y. (2007) Analyse von Strukturgleichungsmodellen mit mehreren Stichproben mit Anwendungen auf Daten zur Lebensqualität, in Handbook of Latent Variable and Related Models , Lee, S.-Y. (Hrsg.), S. 279-302, North -Holland). Einige Methoden, mit solchen Situationen umzugehen:
Nun geht es darum, dass sich die meisten dieser Ansätze auf die Objektebene konzentrieren (Decken- / Bodeneffekt, verminderte Zuverlässigkeit, schlechte Objektpassungsstatistik usw.), aber wenn man interessiert ist, wie die Menschen von dem abweichen, was von einem Ideal erwartet wird Ich denke, wir müssen uns stattdessen auf die Person-Fit-Indizes konzentrieren.
Solche Statistiken sind leicht für die IRT - Modelle zur Verfügung, wie INFIT oder OUTFIT mittleren quadratischen, aber sie gelten im großen und ganzen Fragebogen im Allgemeinen. Da die Schätzung von Elementparametern zum Teil von Personenparametern abhängt (z. B. im Rahmen der Grenzwahrscheinlichkeit, nehmen wir eine Gauß-Verteilung an), kann das Vorhandensein von abgelegenen Personen zu potenziell voreingenommenen Schätzungen und einer schlechten Modellanpassung führen.χ2
Wie von Eid und Zickar (2007) vorgeschlagen, Kombination eines latenten Klassenmodells (um eine Gruppe von Befragten zu isolieren, z. B. diejenigen, die immer auf die extremen Kategorien antworten, im Vergleich zu den anderen) und eines IRT-Modells (um Elementparameter und Personenstandorte auf dem latenten zu schätzen) Merkmal in beiden Gruppen) erscheint eine schöne Lösung. Andere Modellierungsstrategien werden in ihrer Arbeit beschrieben (z. B. HYBRID-Modell, siehe auch Holden und Book, 2009).
Ebenso können Entfaltungsmodelle verwendet werden, um mit dem Antwortstil umzugehen , der als konsistentes und inhaltsunabhängiges Muster der Antwortkategorie definiert ist (z. B. Tendenz, mit allen Aussagen übereinzustimmen). In den Sozialwissenschaften oder in der psychologischen Literatur wird dies als Extreme Response Style (ERS) bezeichnet. Referenzen (1–3) können hilfreich sein, um eine Vorstellung davon zu bekommen, wie sie sich manifestiert und wie sie gemessen werden kann.
Hier ist eine kurze Liste von Artikeln, die dazu beitragen können, in diesem Bereich Fortschritte zu erzielen:
quelle
Die exploratorische Faktoranalyse (EFA) eignet sich (psychometrisch und auf andere Weise) zur Untersuchung des Ausmaßes, in dem sich Zusammenhänge zwischen mehreren Elementen erklären lassen, indem auf den gemeinsamen Einfluss eines oder mehrerer nicht gemessener (dh latenter) Faktoren geschlossen wird. Wenn dies nicht Ihre spezielle Absicht ist, ziehen Sie alternative Analysen in Betracht, z.
Dimensionalität ist das erste Problem, mit dem sich EFA befassen kann. Sie können die Eigenwerte der Kovarianzmatrix untersuchen (z. B. durch Erstellen eines Geröllplots über EFA) und eine parallele Analyse durchführen, um die Dimensionalität Ihrer Maße aufzulösen. (Siehe auch einige gute Ratschläge und alternative Vorschläge von William Revelle .) Sie sollten dies sorgfältig tun, bevor Sie eine begrenzte Anzahl von Faktoren extrahieren und in EFA drehen, oder bevor Sie ein Modell mit einer bestimmten Anzahl latenter Faktoren mithilfe von CFA, SEM oder dergleichen. Wenn eine parallele Analyse auf Mehrdimensionalität hinweist, Ihr allgemeiner (erster) Faktor jedoch alle anderen bei weitem überwiegt (dh bei weitem den größten Eigenwert aufweist / die Mehrheit der Abweichungen in Ihren Maßen erklärt), ziehen Sie die Bifaktoranalyse in Betracht (Gibbons & Hedeker, 1992;Reise, Moore & Haviland, 2010 ) .
Bei der EFA- und Latentfaktormodellierung von Likert-Skalenbewertungen treten viele Probleme auf. Likert-Skalen erzeugen ordinale (dh kategoriale, polytome, geordnete) Daten, keine kontinuierlichen Daten. Bei der Faktoranalyse wird im Allgemeinen davon ausgegangen, dass die Eingabe der Rohdaten kontinuierlich ist, und häufig werden Faktoranalysen von Matrizen der Pearson-Produkt-Moment-Korrelationen durchgeführt, die nur für kontinuierliche Daten geeignet sind. Hier ein Zitat von Reise und Kollegen (2010) :
Ich würde empfehlen, sowohl den ersten als auch den dritten Ansatz zu kombinieren (dh eine diagonal gewichtete Schätzung der kleinsten Quadrate auf der Grundlage einer polychromen Korrelationsmatrix zu verwenden), basierend auf Wang und Cunninghams (2005) Diskussion der Probleme mit typischen Alternativen:
Mir ist nicht klar, ob das gleiche Problem mit der Schätzung der kleinsten Quadrate auch für die DWLS-Schätzung gilt. Unabhängig davon empfehlen die Autoren diesen Schätzer. Falls Sie noch nicht über die Mittel verfügen:
2.15.2
) für diese Pakete:psych
Paket (Revelle, 2013) enthält diepolychoric
Funktion.fa.parallel
Funktion kann dabei helfen, die Anzahl der zu extrahierenden Faktoren zu ermitteln.lavaan
Paket (Rosseel, 2012) bietet eine DWLS-Schätzung für die Analyse latenter Variablen.semTools
Paket enthält dieefaUnrotate
,orthRotate
undoblqRotate
Funktionen.mirt
Paket (Chalmers, 2012) bietet vielversprechende Alternativen unter Verwendung der Item-Response-Theorie.Ich kann mir vorstellen, dass Mplus (Muthén & Muthén, 1998-2011) auch funktionieren würde, aber die kostenlose Demoversion bietet nicht mehr als sechs Messungen und die lizenzierte Version ist nicht billig. Es könnte sich lohnen, wenn Sie es sich leisten können. Die Leute lieben Mplus und der Kundenservice der Muthéns über ihre Foren ist unglaublich!
Wie oben erwähnt, überwindet die DWLS-Schätzung das Problem von Verstößen gegen die Normalitätsannahme (sowohl univariate als auch multivariate), das ein sehr verbreitetes Problem darstellt und in Likert-Bewertungsdaten fast allgegenwärtig ist. Dies ist jedoch nicht unbedingt ein pragmatisches Folgeproblem. Die meisten Methoden sind nicht zu empfindlich gegenüber (stark von) kleinen Verstößen beeinflusst (vgl. Ist das Testen der Normalität im Wesentlichen nutzlos? ). Die Antwort von @ chl auf diese Frage wirft wichtigere, herausragendere Punkte und Vorschläge auch in Bezug auf Probleme mit extremem Antwortstil auf. definitiv ein Problem mit Likert-Skalenbewertungen und anderen subjektiven Daten.
Literatur
· Babakus, E., Ferguson, JCE & Jöreskog, KG (1987). Die Empfindlichkeit der konfirmatorischen Maximum-Likelihood-Faktor-Analyse gegenüber Verstößen gegen Messskalen und Verteilungsannahmen. Journal of Marketing Research, 24 , 222–228.
· Byrne, BM (2006). Strukturgleichungsmodellierung mit EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: Ein mehrdimensionales Item-Response-Theorie-Paket für die R-Umgebung. Journal of Statistical Software, 48 (6), 1–29. Abgerufen von http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD & amp; Hedeker, DR (1992). Bifaktoranalyse für alle Informationen. Psychometrika, 57 , 423–436.
· Knol, DL & Berger, MPF (1991). Empirischer Vergleich zwischen Faktoranalyse und mehrdimensionalen Item Response Modellen. Multivariate Verhaltensforschung, 26 , 457–477.
· Muthén, LK & Muthén, BO (1998-2011). Mplus Benutzerhandbuch (6. Ausgabe). Los Angeles, Kalifornien: Muthén & Muthén.
· Muthén, LK & Muthén, BO (2009). Mplus (Version 4.00). [Computer Software]. Los Angeles, CA: Autor. URL: http://www.statmodel.com .
· Olsson, U. (1979). Maximum-Likelihood-Schätzungen für den polychronen Korrelationskoeffizienten. Psychometrika, 44 , 443–460.
·R Kernteam. (2012). R: Eine Sprache und Umgebung für statistisches Rechnen. R Stiftung für Statistisches Rechnen, Wien, Österreich. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM & Haviland, MG (2010). Bifaktormodelle und Rotationen: Untersuchung, inwieweit mehrdimensionale Daten eindeutige Skalenergebnisse liefern. Journal of Personality Assessment, 92 (6), 544–559. Abgerufen von http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: Verfahren für die Persönlichkeits- und psychologische Forschung. Northwestern University, Evanston, Illinois, USA. Abgerufen von http://CRAN.R-project.org/package=psych . Version = 1.3.2.
· Rosseel, Y. (2012). lavaan: Ein R-Paket für die Modellierung von Strukturgleichungen. Journal of Statistical Software, 48 (2), 1–36. Abgerufen von http://www.jstatsoft.org/v48/i02/ .
· Wang, WC & Cunningham, EG (2005). Vergleich alternativer Schätzmethoden in Bestätigungsfaktoranalysen des Allgemeinen Gesundheitsfragebogens. Psychological Reports, 97 , 3–10.
· Wirth, RJ & Edwards, MC (2007). Item-Faktor-Analyse: Aktuelle Ansätze und zukünftige Richtungen. Psychological Methods, 12 , 58–79. Abgerufen von http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .
quelle
Nur eine kurze Bemerkung, dass Sie die polychrone Korrelation eher mit der Faktoranalyse als mit der traditionellen Korrelations- / Kovarianzmatrix vergleichen möchten.
http://www.john-uebersax.com/stat/sem.htm
quelle