Ist es angemessen, n-Punkt-Likert-Skalendaten als n Versuche aus einem Binomialprozess zu behandeln?

11

Ich habe nie gemocht, wie Leute normalerweise Daten von Likert-Skalen analysieren, als ob Fehler kontinuierlich und Gauß'sch wären, wenn vernünftige Erwartungen bestehen, dass diese Annahmen zumindest an den Extremen der Skalen verletzt werden. Was halten Sie von folgender Alternative:

Wenn die Antwort auf einer Punkt-Skala den Wert annimmt , erweitern Sie diese Daten auf Versuche, von denen den Wert 1 und den Wert 0 haben. Daher behandeln wir die Antwort auf einer Likert-Skala so, als ob dies der Fall wäre ist das offene Aggregat einer verdeckten Reihe von Binomialversuchen (aus kognitionswissenschaftlicher Sicht ist dies tatsächlich ein ansprechendes Modell für die Mechanismen, die an solchen Entscheidungsszenarien beteiligt sind). Mit den erweiterten Daten können Sie jetzt ein Modell mit gemischten Effekten verwenden, das den Befragten als zufälligen Effekt angibt (auch Frage als zufälliger Effekt, wenn Sie mehrere Fragen haben) und die Binomiallinkfunktion verwendet, um die Fehlerverteilung anzugeben.n n k n - kknnknk

Kann jemand Verstöße gegen Annahmen oder andere nachteilige Aspekte dieses Ansatzes erkennen?

Mike Lawrence
quelle
2
Kennen Sie veröffentlichte Forschungsergebnisse, die sich mit den relativen Vorzügen der Verwendung von Likert-Skalen als Intervalle gegenüber Ordnungsdaten befassen? Möglicherweise sind die Fehler bei der Behandlung als Intervallskalen nicht schwerwiegend genug, um einen komplexen Ansatz zu rechtfertigen. Wenn dies der Fall ist, kann Ihr Ansatz einfach eine wilde Gänsejagd sein.

Antworten:

16

Ich kenne keine Artikel zu Ihrer Frage in der psychometrischen Literatur. Es scheint mir, dass geordnete Logistikmodelle, die zufällige Effektkomponenten zulassen, diese Situation ziemlich gut bewältigen können.

Ich stimme @Srikant zu und denke, dass ein proportionales Quotenmodell oder ein geordnetes Probit-Modell (abhängig von der von Ihnen gewählten Link-Funktion) die intrinsische Kodierung von Likert-Elementen und ihre typische Verwendung als Bewertungsskalen in Meinungs- / Einstellungsumfragen oder Fragebögen besser widerspiegeln könnte .

Andere Alternativen sind: (1) Verwendung benachbarter statt proportionaler oder kumulativer Kategorien (wenn ein Zusammenhang mit logarithmisch linearen Modellen besteht); (2) Verwendung von Item-Response-Modellen wie dem Partial-Credit-Modell oder dem Rating-Scale-Modell (wie in meiner Antwort zur Likert-Skalenanalyse erwähnt ). Der letztere Fall ist vergleichbar mit einem Ansatz mit gemischten Effekten, bei dem Probanden als zufällige Effekte behandelt werden, und ist im SAS-System (z. B. Anpassen von Modellen mit gemischten Effekten für wiederholte ordinale Ergebnisse mit dem NLMIXED-Verfahren ) oder R (siehe Band 1 ) leicht verfügbar . 20 des Journal of Statistical Software ). Vielleicht interessiert Sie auch die Diskussion von John Linacre über die Optimierung der Wirksamkeit der Bewertungsskalenkategorie .

Die folgenden Dokumente können ebenfalls nützlich sein:

  1. Wu, CH (2007). Eine empirische Studie zur Transformation von Likert-Daten in numerische Scores . Applied Mathematical Sciences , 1 (58) : 2851 & ndash ; 2862.
  2. Rost, J und und Luo, G (1997). Eine Anwendung eines Rasch-basierten Entfaltungsmodells auf einen Fragebogen zum Jugendzentrismus . In Rost, J und Langeheine, R (Hrsg.), Anwendungen latenter Merkmale und latenter Klassenmodelle in den Sozialwissenschaften , New York: Waxmann.
  3. Lubke, G und Muthen, B (2004). Die Faktoranalyse von Likert-Skalendaten unter der Annahme einer multivariaten Normalität erschwert einen aussagekräftigen Vergleich der beobachteten Gruppen oder latenten Klassen . Structural Equation Modeling , 11 : 514-534.
  4. Nering, ML und Ostini, R (2010). Handbuch der Modelle der Polytomous Item Response Theory . Routledge Academic
  5. Bender R und Grouven U (1998). Verwendung binärer logistischer Regressionsmodelle für Ordnungsdaten mit nicht proportionalen Quoten. Journal of Clinical Epidemiology , 51 (10) : 809 & ndash ; 816. (Kann das PDF nicht finden, aber dieses ist verfügbar, Ordinale logistische Regression in der medizinischen Forschung )
chl
quelle
1
Die ordinale logistische Regression mit gemischten Effekten ist auch in R mit dem Ordnungspaket und clmm () verfügbar.
John
9

Wenn Sie die Annahme von Intervalldaten für Likert-Skalen wirklich aufgeben möchten, würde ich vorschlagen, dass Sie stattdessen davon ausgehen, dass es sich bei den Daten um ein geordnetes Logit oder Probit handelt. Likert-Skalen messen normalerweise die Stärke der Reaktion, und daher sollten höhere Werte eine stärkere Reaktion auf das zugrunde liegende interessierende Element anzeigen.

HS

y=1Sα1

y=h αh1<S αhh=2,3,..H1

y=H αH1<S< 

S


quelle
2

npnp(1p)yp

Prn=4(Y=y)Prn=9(Y=2y)+Prn=9(Y=2y+1)
Ich erinnere mich an einige Untersuchungen, die dies zu belegen scheinen: Coelho & Esteves (2006), „Die Wahl zwischen einer Fünf-Punkte- und einer Zehn-Punkte-Skala im Rahmen der Messung der Kundenzufriedenheit“.
Scortchi - Monica wieder einsetzen
quelle
1

Sie könnten die Binomialnäherung in einer 5-Punkte-Likert-Skala verwenden, wenn Sie die Übereinstimmung und die starke Übereinstimmung in einer Gruppe und die Nichtübereinstimmung und die starke Nichtübereinstimmung in einer anderen Gruppe kombinieren. Natürlich müssen Sie noch entscheiden, wohin die Neutralen gehen. Ich würde die Neutralen in eine beliebige Gruppe einordnen, die normale Annäherung an das Binomial verwenden (vorausgesetzt, Sie haben mehr als 40 Antworten) und Konfidenzintervalle für die Proportionen jeder Gruppe entwickeln (siehe jeden Standardstatistik-Text, wie Sie conf erhalten. Intervalle für Proportionen, die aus einer Binomialverteilung mit normaler Näherung stammen). Dann würde ich die Neutralen in die andere Gruppe einordnen und die Konfidenzintervalle wiederholen. Wenn ich aus beiden die gleiche Schlussfolgerung ziehe, gibt es eine mögliche Schlussfolgerung. Ansonsten sehe ich nicht, wie das Binomial mit Likert-Daten verwendet werden kann.

user35193
quelle
0

Wenn ich es richtig verstanden habe, schlägt dieses Papier einen sehr ähnlichen Ansatz vor wie das, was Sie beschrieben haben, was darauf hindeutet, dass Likert-ähnliche Daten tatsächlich aus einem Binomialprozess hervorgehen können.

Vollständige Referenz: Allik, J. (2014). Ein Mixed-Binomial-Modell für Likert-Persönlichkeitsmaße. Frontiers in Psychology , (5) 371

KasiaM
quelle
Willkommen auf der Seite! Könnten Sie eine vollständige Referenz für dieses Papier hinzufügen? Hier ist es Standard, weil Links dazu neigen, tot zu werden.
mkt - Reinstate Monica
-1

Eigentlich bereite ich ein Papier vor, in dem ich Ihren Ansatz verwende, eine Antwort auf ein Likert-Objekt so zu behandeln, als wäre es das offene Aggregat einer verdeckten Reihe von Binomialversuchen.

In meiner Arbeit wird die Binomialverteilung verwendet, um die Form der beobachteten Häufigkeitsverteilungen zu erklären. Die Gründe für diesen Ansatz sind zwei Annahmen. In vielen Applets, die zeigen, wie die Binomialverteilung entsteht, hat man unabhängige Bernoulli-Versuche wiederholt, indem eine einzelne Kugel durch eine Reihe von Stiften fiel. Jedes Mal, wenn ein Ball auf einen Stift fällt, springt er mit der Wahrscheinlichkeit p nach rechts (dh ein Erfolg) oder mit der Wahrscheinlichkeit 1-p nach links (dh ein Fehler). Nachdem der Ball durch das Array gefallen ist, landet er in einem Behälter, der durch die entsprechende Anzahl von Erfolgen gekennzeichnet ist. In meiner Arbeit wird der Entscheidungsprozess auch als eine Reihe wiederholter unabhängiger Bernoulli-Versuche angesehen, bei denen der Proband bei jedem Versuch entscheidet, der fraglichen Aussage zuzustimmen oder nicht zuzustimmen.

(i) Bei jedem unabhängigen Bernoulli-Versuch trifft der Proband die Entscheidung, der Wahrscheinlichkeit p zuzustimmen oder der Wahrscheinlichkeit 1-p nicht zuzustimmen (nicht zuzustimmen).

(ii) Wenn fünf Antwortkategorien für die Erklärung verfügbar sind, entspricht die Häufigkeit, mit der eine Bernoulli-Entscheidung bezüglich der Entscheidung getroffen wird, zuzustimmen oder nicht zuzustimmen (nicht zuzustimmen), 4 (5-1).

Die endgültige Auswahl für eine bestimmte Antwortkategorie wird durch die folgenden Regeln gegeben.

  • Wenn in allen (vier) Fällen eine Bernoulli-Einigungsentscheidung getroffen wird, wird die Antwort "stark einverstanden" gegeben.

  • Wenn in drei Fällen eine Bernoulli-Einigungsentscheidung getroffen wird, wird die Antwort "zustimmen" gegeben.

  • Wenn in zwei Fällen eine Bernoulli-Einigungsentscheidung getroffen wird, wird die Antwort "unentschlossen" gegeben.

  • Wenn nur in einem Fall eine Bernoulli-Einigungsentscheidung getroffen wird, wird die Antwort "nicht einverstanden" gegeben.

  • Wenn in keinem Fall eine Bernoulli-Einigungsentscheidung getroffen wird, wird die Antwort "trifft überhaupt nicht zu" gegeben.

Eine ähnliche Begründung kann unter Verwendung von "nicht einverstanden" Entscheidungen gegeben werden. Um eine Binomialverteilung zu erhalten, ist die Bewertung der Antwortkategorien wie folgt.

stimme überhaupt nicht zu = 0, stimme überhaupt nicht zu = 1, neutral = 2, stimme zu = 3, stimme voll zu = 4

Diese beiden Annahmen führen zu einer Binomialverteilung für die Antwortfrequenzen, sofern keine systematischen Unterschiede zwischen den Befragten bestehen.

Ich hoffe du kannst zustimmen. Ich würde mich sehr freuen, wenn Sie mein Englisch im obigen Text verbessern könnten.

Ad van der Ven
quelle
Ich habe Ihre ältere Antwort entfernt. Bitte beachten Sie, dass mein Kommentar nicht als negative Bemerkung gedacht war. Einzeilige Antworten sind im Allgemeinen nicht sehr informativ und streitbare Antworten sind vorzuziehen (siehe jedoch unsere FAQ ).
Chl
1
Dies ist ein interessanter und kreativer Vorschlag, aber ich bin skeptisch. Sowohl in Ihrer Version als auch in der ordinalen logistischen Regression, wie sie beispielsweise von anderen in diesem Thread vorgeschlagen wird, ist die Annahme einer proportionalen Quote erforderlich. OLR ermöglicht es jedoch, dass die Schwellenwerte / Schnittpunkte b / t der Kategorien flexibler variieren, glaube ich, während sie durch die Binomialparameter & in Ihrem Schema bestimmt werden. Diese Annahme müsste anhand der Daten überprüft werden, und ich vermute, dies würde zu Problemen führen. (Übrigens, die -1 kam nicht von mir.)npn
Gung - Reinstate Monica