Wie kann man Unterschiede zwischen Medianen mehrerer Likert-Elemente testen?

8

In einer Fragebogenstudie haben wir die Befragten gebeten, ihre Einstellung dazu auszudrücken, wie sich unterschiedliche Winterklimafaktoren wie Schnee und Rutschgefahr auf ihre Entscheidung auswirken, zu Fuß oder mit dem Fahrrad zur Arbeit zu fahren. Die Stichprobe bestehend aus 500 Personen und Antworten bestand aus 5 Bewertungsskalen, die sehr negativ bis sehr positiv waren (Ordnungsskala).

Wenn ich die Antworten auf verschiedene Fragen vergleichen möchte, ist der Median ein geeignetes Werkzeug, da die Daten ordinal sind. Ich weiß, dass zum Vergleichen bedeutet, dass es verschiedene statistische Tests gibt, die zeigen, ob die Wahrscheinlichkeit eines Unterschieds signifikant ist (t-Test oder nichtparametrischer Test ..). Aber ich bin ein bisschen verwirrt, ob ich diesen Test für die Art von Daten verwenden kann, die ich hier erklärt habe.

  • Gibt es eine Teststatistik zum Vergleichen von Medianen?
  • Oder sollte ich Daten auf Intervallskala übertragen, wenn es angebracht ist?
Saeed
quelle

Antworten:

4

Ich finde, dass der Mittelwert ein viel nützlicherer Indikator für die zentrale Tendenz von Likert-Gegenständen ist als der Median. Ich habe meine Argumentation hier auf eine Frage ausgeführt, in der gefragt wird, ob der Mittelwert oder der Median für Likert-Elemente verwendet werden soll .

Eine Zusammenfassung einiger dieser Gründe:

  • Der Mittelwert ist informativer; Der Median ist für Likert-Artikel zu brutto. Zum Beispiel ist der Median von 1 1 3 3 3der gleiche wie 3 3 3 5 5(dh 3), aber der Mittelwert spiegelt die Differenz wider.
  • Likert-Elemente werden häufig so formuliert, dass die Annahme des gleichen Abstands zwischen den Kategorien ein nützlicher Ausgangspunkt ist.
  • Selbst wenn einzelne Antworten diskret sind, nähert sich die Messung auf Gruppenebene der Kontinuität (bei 500 Personen und einer 5-Punkte-Skala kann der Wert Ihres Mittelwerts 500 * 4 + 1 = 2001unterschiedliche Werte annehmen ).
  • Es gibt wenig Argumente dafür, dass ein Prozentsatz eine nützliche Zusammenfassung bei Fragen vom Typ Ja-Nein (z. B. Abstimmung) ist. Dies ist nur der Mittelwert, in dem die Antworten codiert wurden 0 and 1. Eine 5-Punkte-Likert-Skala so zu behandeln, wie es 1 2 3 4 5mir fast so natürlich erscheint.
  • Andere plausible Skalierungen der Likert-Elemente ändern wahrscheinlich nicht wesentlich die Schlussfolgerungen darüber, ob Unterschiede zwischen den Mitteln bestehen (dies können Sie jedoch überprüfen).

Wenn Sie davon überzeugt sind, dass der Mittelwert das geeignete Maß für die zentrale Tendenz ist, möchten Sie Ihre Hypothesentests so strukturieren, dass sie auf Unterschiede zwischen den Mittelwerten prüfen. Ein gepaarter Stichproben-t-Test würde einen paarweisen Vergleich der Mittelwerte ermöglichen, aber es würde Probleme hinsichtlich der Genauigkeit von p-Werten angesichts der diskreten und nicht normalen Fehlerverteilung geben. Ein nicht parametrischer Ansatz ist jedoch keine Lösung, da er die Hypothese ändert.

Ich würde erwarten, dass der gepaarte Stichproben-T-Test zumindest für typische Likert-Artikel ziemlich robust ist, die beide Extreme auf der Skala vermeiden, aber ich habe keine Simulationsstudien zur Hand.

Jeromy Anglim
quelle
2

Im Allgemeinen stimme ich Jeromys Argumenten zu, dass der Mittelwert eine vernünftige Statistik für Likert-Skalen ist. Was für den Median sprechen könnte, ist, dass der Median ein viel robusteres Maß für den Standort ist, da er vor Ausreißern schützt (er hat den höchstmöglichen Ausfallpunkt von 50%). Da es sich bei Likert-Skalen jedoch um begrenzte Skalen handelt, ist die Wahrscheinlichkeit extremer Ausreißer sehr gering (nur wenn Ihre Daten extrem verzerrt sind). Darüber hinaus schneidet der Median normalerweise zu stark von den Daten ab, sodass Sie stattdessen die Verwendung von getrimmten Mitteln in Betracht ziehen können. Eine Menge von 20% Trimmen wird normalerweise empfohlen [1].

Wenn Sie einen gepaarten Test der Median-Differenz berechnen möchten, würde ich empfehlen, die Mittelwerte mit einer Perzentil-Bootstrap-Methode zu vergleichen (dies ist die einzige Methode zum Vergleichen von Medianen, die bei gebundenen Werten gut funktioniert, siehe Wilcox, 2005 [) 1]).

Im WRS- Paket für R gibt es eine aufgerufene Funktion, trimpb2die diese Berechnung für zwei unabhängige Stichproben durchführt (mit dieser Funktion können Sie auch den ap-Wert für Trimmend-Mittelwerte berechnen). In Ihrem Fall müssen Sie jedoch abhängige Gruppen vergleichen. In diesem Fall können Sie auch eine vorspannungsangepasste Perzentil-Bootstrap-Methode ausführen [2].

Beachten Sie jedoch, dass der Unterschied der Mediane der Randverteilungen nicht mit dem Median der Differenzwerte identisch ist . Die erste beantwortet die Frage 'Wie unterscheidet sich die typische Antwort der ersten Gruppe von der zweiten?' Und wird von der WRS-Funktion ausgeführt rmmcppb. Die zweite Frage beantwortet die Frage "Was ist die typische Differenzbewertung?" Und wird von der WRS-Funktion ausgeführt rmmcppbd.

[1] Wilcox, RR (2005). Einführung in die robuste Schätzung und das Testen von Hypothesen. San Diego: Akademische Presse.

[2] Wilcox, RR (2006). Paarweise Vergleiche abhängiger Gruppen basierend auf Medianen. Computational Statistics & Data Analysis, 50, 2933 & ndash; 2941. doi: 10.1016 / j.csda.2005.04.017

Felix S.
quelle
0

Eine Option zum Vergleichen von Medianen sind Permutationstests . Wenn Sie jedoch die Antworten 2 Fragen vergleichen, die von derselben Gruppe von Personen ausgefüllt wurden (gepaarte Daten), sollten Sie sich auch McNemars Test und die Variationen davon ansehen .

Um es ein wenig zu verdeutlichen, besteht die Idee des McNemar-Tests (und seiner Erweiterungen) darin, eine Matrix mit der Anzahl der Befragten zu betrachten, die die Kombinationen ausgewählt haben, sodass eine Person zur Anzahl in der Zelle beiträgt, deren Spalte durch bestimmt wird Ihre Antwort auf Frage 1 und Zeile wird durch ihre Antwort auf Frage 2 bestimmt (Tabellen- oder Crosstable-Befehle erstellen die Matrix). Das Muster in dieser Matrix ist wahrscheinlich informativer als ein einfacher Mittelwert oder Median. Die Diagonale stellt Personen dar, die auf die beiden Fragen gleich geantwortet haben, das obere Dreieck sind diejenigen, die auf die erste Frage höher geantwortet haben als auf die zweite Frage, und das untere Dreieck den Unterschied. Der Abstand von der Diagonale gibt an, wie unterschiedlich die beiden Antworten waren. Variationen des McNemar-Tests untersuchen, ob die Zählungen in den beiden Dreiecken unterschiedlich sind. oder wenn die Matrix symmetrisch ist. Um die ordinale (vs. nominale) Natur der Daten zu berücksichtigen, wird der Abstand von der Diagonale berücksichtigt.

Nur die Muster in der Tabelle zu betrachten, mag für Ihre Zwecke ausreichen. Wenn Sie jedoch einen formalen Test benötigen, können Sie entweder die vorgeschlagenen Tests durchführen oder eine Art Permutationstest durchführen (genau wie hängt davon ab, wonach Sie suchen oder versuchen zu zeigen).

Greg Snow
quelle
3
McNemars Test bezieht sich auf nominelle Daten. Für Ordnungsdaten, wie hier, wählen die Menschen oft die Wilcoxon - Rank - Test unterzeichnet oder Vorzeichentest (aber die Macht des letzteren neigt dazu , gering zu sein).
whuber
Das Problem mit Saeeds Frage ist, dass sie einen Vergleich der Mediane verwandter , nicht unabhängiger Verteilungen erforderten. Der T-Test mit gepaarten Stichproben vergleicht die Mittelwerte, da sein Zähler - der Mittelwert der Unterschiede pro Fall - der gleiche Wert ist wie die Differenz zwischen den beiden Mittelwerten. Für den Median ist der Median der Unterschiede pro Fall jedoch nicht der gleiche Wert wie der Unterschied zwischen den beiden Medianen. Daher bezweifle ich, dass es einen Test gibt, der genau als "Test der Mediane für gepaarte Proben" bezeichnet werden könnte.
ttnphns