Ist 0 ein gültiger Wert in einer Likert-Skala?

8

Ich habe meine Pilotstudie zur Motivation des Sprachenlernens auf einer 6-Punkte-Likert-Skala durchgeführt, aber von 0 (stimme überhaupt nicht zu) bis 5 (stimme voll zu). Ich habe festgestellt, dass ein Kollege in seiner Umfrage 1 bis 6 verwendet hat. Werden meine berechneten Variablen (Summe und Mittelwert) dieselben sein, als hätte ich 1 bis 6 verwendet? Wird normalerweise aus irgendeinem Grund empfohlen, keine 0 zu verwenden? Ich bin neu bei SPSS, habe aber das meiste geschafft, was ich tun muss, aber ich mache mir jetzt Sorgen, dass meine Werte "verzerrt" sind. Ich verstehe nicht, wie SPSS einer Gleichung eine 0 hinzufügt.

Imelda
quelle
6
Ich vermute - aber ohne Beweise liefern zu können -, dass es einen psychologischen Unterschied zwischen den Skalen 1..6 und 0..5 geben kann, der hauptsächlich auf Unterschiede in der Art und Weise zurückzuführen ist, wie 0 von Menschen im Vergleich zu ihren Wahrnehmungen erlebt und verstanden wird von positiven ganzen Zahlen, und vielleicht, weil die Leute in Bezug auf das Maximum denken, so dass in einem Fall die Änderung von 5 auf 6 1/6 des Maximums beträgt, während sie in dem anderen Fall (fälschlicherweise) als gleich angesehen wird 1/5 des Maximums. Vielleicht könnten Psychologen in unserer Gemeinde einige Gedanken dazu machen?
whuber
2
@whuber In der Tat ist dies ein langjähriges Thema im Fragebogendesign - insbesondere im Hinblick auf uni- oder bipolare Skalen. Eine Übersicht finden Sie unter Schwarz. 1996. Erkenntnis und Kommunikation: Urteilsverzerrungen, Forschungsmethoden und die Logik der Konversation. Mahwah, NJ: Lawrence Erlbaum. Einige weitere Referenzen .
Caracal
Ich denke, dieser vorherige Beitrag zu Likert-Skalenkategorien könnte helfen.
David
7
5-Punkte-Likert-Artikel werden häufig verwendet, wenn die Antwortkategorien "Stark nicht übereinstimmen", "Nicht übereinstimmen", "Weder ag. Noch nicht übereinstimmen", "Ag." Und "Stark ag." Ohne explizite Zahlen sind Ergebnis. Was ist deine 6. Kategorie? Die Antwortcodierung ist für Regressionen, Datenprüfungen oder zusammenfassende Statistiken unerheblich. Jede Skalierungs-, Verknüpfungs- oder Gleichstellungsmethode kann dies berücksichtigen. Was wirklich wichtig ist, ist das zugrunde liegende Messmodell, das Sie annehmen können, da es bestimmt, ob Scores als stichprobenabhängige diskrete Scores oder als "Reflexion" eines latenten Merkmals auf einer diskreten Skala behandelt werden sollen.
Chl
Ich bin das Plakat der ursprünglichen Frage. Der gesamte Motivationsfragebogen bestand aus 80 Elementen, die in 16 Unterskalen zusammengefasst waren, wobei ein Kriterium für den beabsichtigten Aufwand ebenfalls auf der Likert-Skala bewertet wurde. Alle Antworten waren 0 (stimme überhaupt nicht zu) bis 5 (stimme voll und ganz zu). Vielen Dank für die aufschlussreichen Antworten, auf deren Grundlage ich die ursprüngliche Bewertung beibehalten habe.

Antworten:

8

Lassen Sie mich ein paar Punkte ansprechen. Erstens, wenn Sie nur noch 1 Frage, haben Sie nicht technisch eine likert Skala , sondern nur eine Ordnungs Bewertung. Ich kann jedenfalls nicht sehen, wie es einen bedeutenden Unterschied geben wird. Dies ist nur eine lineare Verschiebung. Dies macht weder einen Unterschied, ob Sie eine Ordnungsanalyse wie die ordinale logistische Regression oder einen Mann-Whitney-U-Test verwenden, noch eine Standardoption wie die OLS-Regression oder einen T-Test.

gung - Monica wieder einsetzen
quelle
7

Ich muss @MichaelChernick teilweise widersprechen. Während die Antworten auf eine einzelne Likert-Frage (ob 0 bis 5 oder 1 bis 6 oder was auch immer) eindeutig ordinal sind, gibt es normalerweise eine Summe mehrerer Likert-Skalenelemente. Irgendwann wird die Anzahl der möglichen Werte so hoch, dass sie im Wesentlichen kontinuierlich ist.

Wie Sie wissen (aber das Poster der Frage möglicherweise nicht), geht die OLS-Regression nicht davon aus, dass die abhängige Variable normal verteilt ist, sondern nur davon, dass die Fehler (wie durch die Residuen geschätzt) sind.

Wenn wir eine Reihe von Likert-Elementen zusammenfassen, wissen wir dann, dass die Intervalle wirklich gleich sind? Nein nicht wirklich. Aber wissen wir das für, sagen wir IQ? Oder sogar Einkommen? Ist der Unterschied zwischen einem IQ von 130 und 140 gleich 100 und 110? Ist diese Frage überhaupt sinnvoll? Was ist mit einer 10.000- Dollar- Spende für jemanden, der macht ? $ 10.000 gegen $ 100.000 pro Jahr?

Ich habe einen ganzen Blog-Beitrag geschrieben dazu geschrieben.

Außerdem ist mir nicht klar, ob diese Likert-Skala eine abhängige oder unabhängige Variable sein wird.

Peter Flom
quelle
Ich denke, es hängt davon ab, ob das OP einzelne Fragen oder Gruppen von Fragen vergleichen möchte (in der Umfrageliteratur häufig als Domänen bezeichnet). Aber wie werden die Summen von ganzen Zahlen kontinuierlich? Sie sind größer, aber immer noch ganze Zahlen und nicht stetig. Außerdem ändert sich die Summe nicht auf magische Weise von ordinal zu nominal, sodass ich nicht verstehe, was Sie sagen wollen. OLS geht davon aus, dass die Kovariaten fest sind und die Residuen normal sind. Tatsächlich bedeutet dies, dass die von den Kovariaten konditionierte abhängige Variable normal ist.
Michael R. Chernick
2
@Michael Vielleicht möchten Sie sich einige frühere Diskussionen darüber ansehen, ob Likert-Skalen als kontinuierlich oder diskret behandelt werden sollen . Die variable Bewertung spiegelt manchmal die Art und Weise wider, wie wir uns die Daten vorstellen. Ich kann auch De Boeck, P., Wilson, M. und Acton, GS (2005) empfehlen. Ein konzeptioneller und psychometrischer Rahmen zur Unterscheidung von Kategorien und Dimensionen . Psychological Review , 112 (1): 129 & ndash; 158.
Chl
5

Bei der Weiterverfolgung der Referenzvorschläge von @ caracal fand ich eine fast direkte Antwort ( nein, diese beiden Bewertungssysteme sind nicht gleichwertig, wenn sie den Befragten als Zahlenoptionen präsentiert werden ) von Schwarz, Knäuper, Hippler, Noelle-Neumann und Clark (1991). . Sie präsentieren Daten zu Antworten auf die Frage: "Wie erfolgreich waren Sie bisher im Leben?" Eine Version bot Bewertungsoptionen von 0 bis 10 bis 480 Teilnehmern; Die andere Version hatte Optionen von (-5) - (+ 5) mit Null als Mittelpunkt und wurde von 552 Teilnehmern gesehen. Die Endpunkte wurden in beiden Versionen als "überhaupt nicht erfolgreich" und "äußerst erfolgreich" gekennzeichnet. "Unentschlossen" war auch eine Option für beide. So haben sich die Dinge entwickelt:

0–10 Skala- -5 bis +5 SkalaSkalierungswertProzentsatzKumulativSkalierungswertProzentsatzKumulativ0......- -5111......- -4...1222- -312357- -2134714- -11452034091361448+192272068+2234582088+335809694+4149410397+5498Unentschieden3100U.ndecichded2100

χ2(10)=105.1,p<.0001 für diesen Unterschied an. Natürlich wird dieser Unterschied nicht angezeigt, wenn der Unterschied nur in Bezug auf die Art und Weise, wie Sie Antworten codieren, hinter den Kulissen liegt und für die Teilnehmer nicht sichtbar ist, damit sie Antworten bereitstellen können.


Es gibt einfache Methoden für das Umfragedesign, mit denen man sich keine Gedanken über die psychologischen Auswirkungen der Gleichsetzung von Bewertungsankern mit Zahlen machen muss. Grundsätzlich können Sie die Verwendung von Zahlen vermeiden! Z.B:

  1. Ermöglichen Sie den Befragten, Zellen in einer Tabelle zu überprüfen, die ihrer Antwortpräferenz entsprechen: Jede Zeile kann ein anderes Element sein, und jede Spalte kann mit Ihrem Bewertungsanker gekennzeichnet sein oder umgekehrt - es sind keine Zahlen beteiligt. So könnte das aussehen (wenn man mit Bedacht antworten würde):

    Entschieden widersprechenNicht zustimmenMild nicht einverstandenMild zustimmenZustimmenStimme voll und ganz zuBecher: besser als Pumpen!Ich sehe in diesem Kleid fett aus.

    Wikipedia gibt einen anderen Stil mit markierten Optionen (von Nicholas Smith ):

  2. Buchstabencodes können auch durch numerische Optionen ersetzt werden, wenn für eine Liste mit sehr vielen Elementen Leerzeichen ausgefüllt werden sollen. zB { SD, D, MD, MA, A, SA}. Vergessen Sie nicht, die Legende aufzunehmen!


Referenz
Schwarz, N., Knäuper, B., Hippler, HJ, Noelle-Neumann, E. & Clark, L. (1991). Die numerischen Werte der Bewertungsskalen können die Bedeutung der Skalenbeschriftungen ändern. Public Opinion Quarterly, 55 (4), 570–582.

Nick Stauner
quelle
Gibt es einen Grund, unzählige Skalen als besser anzusehen ?
Scortchi - Monica wieder einsetzen
1
@ Scortchi: Sie sollten zumindest die Mehrdeutigkeit der Antworten verringern. Es ist mir unwahrscheinlich, dass Befragte und Forscher sich gegenseitig besser verstehen, wenn sie die Sprachen verbaler und numerischer Anker mischen. Es ist wahrscheinlicher, dass Forscher ihre Indizes willkürlich und naiv gestalten und die Befragten entscheiden, wie sie inkonsistent (sowohl zwischen als auch innerhalb von Subjekten) reagieren, basierend auf dem Satz von Ankern, der für sie persönlich im Allgemeinen sinnvoller ist, oder schlimmer für bestimmte Gegenstände . Vielen Dank für Ihre aufschlussreiche Bearbeitung BTW. Scharfes Auge!
Nick Stauner
1
Dies ist nur meine Intuition, die jetzt übrigens gesprochen wird, aber zum Beispiel könnte ein Punkt wie "Dies ist eine gute Antwort" durch die Verbindung mit dem typischen akademischen Bewertungssystem, das von 0 bis 100% Kredit reicht, eher eine Skala von 0 bis 10 ansprechen ... in der Erwägung, dass "Obama ein guter Präsident ist" eher ein (-5) - (+ 5) -System ansprechen könnte, weil es Konservativen eine Möglichkeit geben würde, ihr Verletzungsgefühl auszudrücken, nicht nur ihre Unzufriedenheit. Ich vermute, dass die letztere Frage keine Präferenz zwischen verbalen und numerischen Bewertungssystemen erzeugen würde, während das numerische System für die erstere Frage leicht bevorzugt werden könnte.
Nick Stauner
1
... nur in Bezug darauf, wie Menschen über ihre Antwortentscheidungen denken würden, wobei ihre Entscheidungen zwischen verbalen und numerischen Bewertungssystemen wahrscheinlich auf einer vorbewussten / automatischen / weniger als absichtlichen Ebene getroffen werden, meistens bei Teilnehmern mit unterschiedlichem Grad an Selbstbewusstsein , Liebe zum Detail oder " psychologische Gesinnung ". Während des Ausfüllens eines langen Fragebogens wird etwas gelernt. IIRC, dies führt zu konsistenteren (möglicherweise voreingenommenen) Antworten, wenn Elemente miteinander verschwimmen. </ wilde Spekulationen und Vermutungen>
Nick Stauner
1
Das klingt alles sehr plausibel - ich gebe zu, ich habe nach einer anderen Studie gesucht, die sich mit der Frage befasst. (Ich erinnere mich an einen, der angeblich die Existenz eines "Zaunsitz" -Effekts zeigt, bei dem die mittlere Ebene eines Gegenstands mit einer ungeraden Anzahl von Ebenen im Vergleich zu den beiden mittleren Ebenen eines Gegenstands mit einer geraden Anzahl von Ebenen überrepräsentiert war . - Ich werde den Ref.
Veröffentlichen,
2

Um eine Analyse mit Ordnungsskalen wie dem Likert durchzuführen, würden Sie nichtparametrische Methoden verwenden, die auf Rängen basieren. Was bei Ordnungsskalen wichtig ist, ist die Reihenfolge, in der 5 am besten, 0 am schlechtesten, 1 besser als 0, 2 besser als 1 usw. ist. Sowohl Verhältnisse als auch Intervalle sind für Ordnungsdaten bedeutungslos. Eine Skala von 1-6 gegenüber 0-5 spielt also keine Rolle und hat keinen Einfluss auf die Analyse. Das Beginnen mit 1 beruht eher auf Tradition als auf Notwendigkeit.

Michael R. Chernick
quelle
2
"Sowohl Verhältnisse als auch Intervalle sind für Ordnungsdaten bedeutungslos" hängt vom zugrunde liegenden Messmodell ab, das Sie annehmen möchten.
Chl
@Chl Was ist dein Punkt?
Michael R. Chernick
3
Mein Punkt ist, dass bestimmte psychometrische Modelle diskrete Antworten explizit als Proxy betrachten, der den Standort (oder die Haftung) eines Menschen auf einem latenten Merkmal widerspiegelt, wie in einer meiner Antworten beschrieben . Ich bin mit dem Rest Ihrer Antwort einverstanden, die im Wesentlichen auf der Idee basiert, Summenwerte (in diesem Fall nicht, aber Sie werden die Idee bekommen) als Mittel zu behandeln, um Personen auf einem bestimmten Konstrukt (im CTT-Rahmen) zu bewerten ).
Chl
3
Variablen sind jedoch normalerweise nicht streng ordinale oder Intervalle. Die blinde Anwendung der Stevens-Taxonomie ist genauso schlecht wie die blinde Anwendung jeder anderen Regel. Für eine streng ordinale Zahl könnten Sie eine 0, 2, 2.1, 2.2, 2.3, 19288191 umkodieren. Aber würden Sie? Und was ist außer physikalischen Messungen wirklich ein Intervall?
Peter Flom
2
@Peter Das erinnert mich an diesen älteren Thread: Ist es jemals sinnvoll, kategoriale Daten als kontinuierlich zu behandeln?
Chl
-1

Ich denke, die Punkte sollten gemäß dem Rahmen der Fragen bestimmt werden. Wenn sich die Fragen auf die Einstellung beziehen, sollten Punkte von 1 bis 5 vergeben werden, nicht von 0 bis 4, weil wir versuchen, die Einstellung zu kennen. Und Haltung kann nicht auf 0 Ebene liegen; Selbst die Markierung der Befragten bei der Option "Stimme überhaupt nicht zu", aber wir können 0 (Null) in dieser Antwort nicht erwähnen. Ähnlich können andere Variablen sein. Als Forscher sollten wir also versuchen, die Punkte von 1 bis 5 zu bestimmen. 1-7 etc.

Jiten
quelle