Unter welchen Bedingungen sollten Likert-Skalen als Ordnungs- oder Intervalldaten verwendet werden?

52

Viele sozialwissenschaftliche Studien verwenden Likert-Skalen. Wann ist es angebracht, Likert-Daten als Ordnungszahl zu verwenden, und wann ist es angebracht, sie als Intervalldaten zu verwenden?

Ein Löwe
quelle
6
Technisch gesehen sind Likert-Skalen die Summe der Likert-artigen Elemente und stellen daher (zumindest nach Ansicht vieler Psychometriker in der Psychologie) eine vernünftige Annäherung an einen Intervalldatenpunkt dar.
Russellpierce
2
@drknexus - Mehrere Elemente dienen also als Maßtriangulation für Konstruktskalen? Wenn ja, nach welchen Kriterien kann festgestellt werden, dass ein Forscher über genügend relevante Datenpunkte (dh Elemente) verfügt, um die Skala als Intervallmessung zu verwenden?
Ein Löwe
2
Ich bin mir nicht sicher; Das könnte eine würdige Frage für die Gemeinde im Allgemeinen sein. Ich würde vermuten, dass es sich zum Teil wahrscheinlich um ein Werturteil des Forschers und des Gebiets handelt. Einige Bereiche sind durchaus bereit, einen einzelnen Likert-Gegenstand als Intervall zu behandeln, obwohl dies eindeutig eine Ordnungszahl ist. Eine vernünftige Antwort könnte darin bestehen, eine andere Analysemethode zu verwenden, z. B. einen Permutations- oder Bootstrap-Test. Eine andere Antwort könnte darin bestehen, einen einfachen Test der Normalität durchzuführen, solange das Aggregat nicht wesentlich von der Normalität abweicht.
Russellpierce
1
... aber im Allgemeinen scheint es so, als könnte man den zentralen Grenzwertsatz aufgreifen und vorschlagen, dass 20 bis 30 Elemente ausreichen, um die Skala als Intervallmessung zu verwenden.
Russellpierce

Antworten:

41

Vielleicht zu spät, aber ich füge meine Antwort trotzdem hinzu ...

Dies hängt davon ab, was Sie mit Ihren Daten tun möchten: Wenn Sie zeigen möchten, dass sich die Punktzahlen bei der Betrachtung unterschiedlicher Teilnehmergruppen (Geschlecht, Land usw.) unterscheiden, können Sie Ihre Punktzahlen als numerische Werte behandeln, sofern sie die üblichen Annahmen erfüllen über Varianz (oder Form) und Stichprobengröße. Wenn Sie eher darauf abzielen, die Unterschiede zwischen den Antwortmustern in den Untergruppen herauszustellen, sollten Sie Artikelbewertungen als diskrete Wahl zwischen einer Reihe von Antwortoptionen betrachten und nach logarithmischer linearer Modellierung, ordinaler logistischer Regression, Artikel-Antwort-Modellen oder anderen statistischen Modellen suchen das erlaubt, mit polytomen Gegenständen umzugehen.

Als Faustregel wird allgemein angenommen, dass es ausreicht, 11 verschiedene Punkte auf einer Skala zu haben, um eine Intervallskala zu approximieren (für Interpretationszwecke siehe den Kommentar von @ xmjx). Likert-Elemente können als echte Ordnungsskala betrachtet werden, sie werden jedoch häufig als numerische Elemente verwendet und wir können ihren Mittelwert oder ihre SD berechnen. Dies geschieht häufig in Einstellungsumfragen, obwohl es ratsam ist, sowohl den Mittelwert / SD als auch den Prozentsatz der Antwort anzugeben, z. B. in den beiden höchsten Kategorien.

Wenn Sie summierte Skalenwerte verwenden (dh, wir addieren die Punkte für jedes Element, um eine "Gesamtpunktzahl" zu berechnen), werden möglicherweise die üblichen Statistiken angewendet. Beachten Sie jedoch, dass Sie jetzt mit einer latenten Variablen und damit dem zugrunde liegenden Konstrukt arbeiten sollte Sinn machen! In der Psychometrie prüfen wir im Allgemeinen, dass (1) die Eindimensionnalität der Skala gilt, (2) die Zuverlässigkeit der Skala ausreicht. Beim Vergleich zweier solcher Skalenwerte (für zwei verschiedene Instrumente) könnten wir sogar in Betracht ziehen, abgeschwächte Korrelationsmaße anstelle des klassischen Pearson-Korrelationskoeffizienten zu verwenden.

Klassische Lehrbücher umfassen:
1. Nunnally, JC und Bernstein, IH (1994). Psychometrische Theorie (3. Aufl.). McGraw-Hill-Reihe in Psychologie.
2. Streiner, DL und Norman, GR (2008). Gesundheitsmaßstäbe. Eine praktische Anleitung zu ihrer Entwicklung und Verwendung (4. Aufl.). Oxford.
3. Rao, CR und Sinharay, S., Eds. (2007). Handbuch der Statistik, Bd. 26: Psychometrie . Elsevier Science BV
4. Dunn, G. (2000). Statistik in der Psychiatrie . Hodder Arnold.

Sie können auch einen Blick auf Anwendungen latenter Merkmale und latenter Klassenmodelle in den Sozialwissenschaften von Rost & Langeheine und auf die Website von W. Revelle zur Persönlichkeitsforschung werfen .

Bei der Validierung einer psychometrischen Skala ist es wichtig, die sogenannten Decken- / Bodeneffekte (große Asymmetrie aufgrund der Bewertung der Teilnehmer in der niedrigsten / höchsten Antwortkategorie) zu berücksichtigen, die schwerwiegende Auswirkungen auf alle Statistiken haben können, die bei ihrer Behandlung als numerische Variable berechnet werden ( zB Länderaggregation, t-Test). Dies wirft spezifische Fragen in interkulturellen Studien auf, da bekannt ist, dass sich die Gesamtantwortverteilung bei Einstellungen oder Gesundheitserhebungen von Land zu Land unterscheidet (z. B. Chinesen im Vergleich zu Menschen aus westlichen Ländern heben in der Regel bestimmte Antwortmuster hervor, die ersteren zufolge im Allgemeinen extremere Scores auf Item-Ebene, siehe z. B. Song, X.-Y. (2007). Analyse von Multisample-Strukturgleichungsmodellen mit Anwendungen auf Daten zur Lebensqualität, inHandbuch latenter Variablen und verwandter Modelle , Lee, S.-Y. (Hrsg.), S. 279-302, North-Holland).

Im Allgemeinen sollten Sie sich die psychometrische Literatur ansehen, in der Likert-Artikel in großem Umfang verwendet werden, wenn Sie sich für Messfragen interessieren. Es wurden verschiedene statistische Modelle entwickelt, die derzeit im Rahmen der Item-Response-Theorie behandelt werden.

chl
quelle
2
Nur zur Verdeutlichung: Nunnally / Bernstein schlagen vor, eine Variable als stetig zu behandeln, wenn sie mindestens 11 verschiedene Werte aufweist (S. 115). Woher stammt die Faustregel "12 Punkte bedeuten Intervallskala"?
xmjx
12

Die einfache Antwort ist, dass Likert-Skalen immer ordinal sind. Die Intervalle zwischen den Positionen auf der Skala sind monoton, aber niemals so genau definiert, dass sie numerisch einheitliche Inkremente darstellen.

Die Unterscheidung zwischen Ordnungszahl und Intervall basiert jedoch auf den spezifischen Anforderungen der durchgeführten Analyse. Unter bestimmten Umständen können Sie die Antworten möglicherweise so behandeln, als ob sie auf einer Intervallskala liegen. Zu diesem Zweck müssen die Befragten in der Regel eine enge Übereinstimmung hinsichtlich der Bedeutung der Skalenantworten haben, und die Analyse (oder die auf der Analyse basierenden Entscheidungen) sollte relativ unempfindlich gegenüber eventuell auftretenden Problemen sein.

Tom
quelle
8
John Tukey schrieb etwas anderes (bereits 1960) in einer Monographie "Data Analysis and Behavioral Science" (veröffentlicht in Collected Works v. III). Ein Ergebnis, das er erhalten hat, ist, dass Ihre Skala nicht eng genug ist, wenn Sie besser als etwa 10% der Testwiederholungsübereinstimmung sind!
whuber
Diese Antwort scheint Likert-Skalen mit Original-Bewertungsgegenständen zu verwechseln. Siehe den Kommentar von @ russellpierce.
Rolando2
9

Zusätzlich zu dem, was oben bereits zu den summierten Skalen gesagt wurde, möchte ich auch erwähnen, dass sich das Problem bei der Analyse von Daten auf Gruppenebene ändern kann. Zum Beispiel, wenn Sie untersucht haben

  • Lebenszufriedenheit von Staaten oder Ländern,
  • Arbeitszufriedenheit von Organisationen oder Abteilungen,
  • Schülerzufriedenheit in Fächern.

In all diesen Fällen basiert jede aggregierte Kennzahl (möglicherweise der Mittelwert) auf vielen einzelnen Antworten (z. B. n = 50, 100, 1000 usw.). In diesen Fällen beginnt das ursprüngliche Likert-Element Eigenschaften anzunehmen, die einer Intervallskala auf der Aggregatebene ähneln.

Jeromy Anglim
quelle
-2

Likert-Skala immer in ordinaler Form: Eine Methode, um qualitativen Daten einen quantitativen Wert zuzuweisen, um sie für statistische Analysen zugänglich zu machen. Jeder potenziellen Auswahl wird ein numerischer Wert zugewiesen und am Ende der Bewertung oder Umfrage wird ein Mittelwert für alle Antworten berechnet.

Mubashara Husain
quelle
5
Willkommen auf unserer Webseite! Bitte schreiben Sie Ihr Angebot oder generell alle Wörter, die Sie von jemand anderem geborgt haben.
whuber