Ich habe einige ordinale Daten aus Umfragefragen erhalten. In meinem Fall handelt es sich um Likert- Antworten (stimme überhaupt nicht zu, stimme überhaupt nicht zu, sei neutral, stimme voll und ganz zu). In meinen Daten sind sie als 1-5 codiert.
Ich glaube nicht, dass Mittel hier viel bedeuten würden. Welche grundlegenden Zusammenfassungsstatistiken werden als nützlich erachtet?
descriptive-statistics
likert
ordinal-data
PaulHurleyuk
quelle
quelle
Antworten:
Eine Frequenztabelle ist ein guter Ausgangspunkt. Sie können die Zählung und die relative Häufigkeit für jedes Level vornehmen. Außerdem können die Gesamtzahl und die Anzahl der fehlenden Werte hilfreich sein.
Sie können auch eine Kontingenztabelle verwenden, um zwei Variablen gleichzeitig zu vergleichen. Kann auch mithilfe eines Mosaikplots angezeigt werden.
quelle
Ich werde aus einer angewandten Perspektive argumentieren, dass der Mittelwert oft die beste Wahl ist, um die zentrale Tendenz eines Likert-Gegenstands zusammenzufassen. Insbesondere denke ich an Kontexte wie Umfragen zur Schülerzufriedenheit, Marktforschungsskalen, Mitarbeiterumfragen, Persönlichkeitstests und viele sozialwissenschaftliche Umfragen.
In solchen Kontexten möchten Verbraucher von Forschung häufig Antworten auf Fragen wie:
Für diese Zwecke hat der Mittelwert mehrere Vorteile:
1. Der Mittelwert ist einfach zu berechnen:
2. Mean ist relativ gut verstanden und intuitiv:
0, 0, 0, 1, 1
Codierung.3. Der Mittelwert ist eine einzelne Zahl:
4. Es macht keinen großen Unterschied
quelle
Für grundlegende Zusammenfassungen stimme ich zu, dass die Berichterstattung über Häufigkeitstabellen und einige Angaben zur zentralen Tendenz in Ordnung ist. In einem kürzlich in PARE veröffentlichten Artikel wurden t- und MWW-Test, Fünf-Punkte-Likert-Items: t-Test gegen Mann-Whitney-Wilcoxon, diskutiert .
Für eine ausführlichere Behandlung würde ich empfehlen, Agrestis Rezension zu geordneten kategorialen Variablen zu lesen:
Es geht weit über die üblichen Statistiken wie Schwellenwertmodelle (z. B. Proportional Odds Ratio) hinaus und ist eine Lektüre anstelle von Agrestis CDA- Buch wert .
Im Folgenden zeige ich ein Bild von drei verschiedenen Möglichkeiten, einen Likert-Gegenstand zu behandeln. von oben nach unten die "Frequenz" -Ansicht (nominal), die "numerische" Ansicht und die "probabilistische" Ansicht (ein Teilkreditmodell ):
Die Daten stammen aus den
Science
Daten in demltm
Paket, in dem sich der Gegenstand auf die Technologie bezieht ("Neue Technologie hängt nicht von der wissenschaftlichen Grundlagenforschung ab", mit der Antwort "trifft überhaupt nicht zu", "trifft voll zu", auf einer Vier-Punkte-Skala).quelle
Üblicherweise werden zur Beschreibung von Ordnungsdaten die Rangsumme und der Mittelwert der nichtparametrischen Statistik verwendet.
So funktionieren sie:
Rang Summe
Weisen Sie jedem Mitglied in jeder Gruppe einen Rang zu.
Angenommen, Sie sehen sich die Tore für jeden Spieler in zwei gegnerischen Fußballmannschaften an und ordnen dann jedes Mitglied von Anfang bis Ende in beiden Mannschaften.
Berechnen Sie die Rangfolge, indem Sie die Ränge pro Gruppe addieren .
Die Größe der Rangsumme gibt an, wie eng die Ränge für jede Gruppe zusammenliegen
Mittlerer Rang
M / R ist eine komplexere Statistik als R / S, da es ungleiche Größen in den Gruppen ausgleicht, die Sie vergleichen. Daher dividieren Sie zusätzlich zu den obigen Schritten jede Summe durch die Anzahl der Mitglieder in der Gruppe.
Sobald Sie diese beiden Statistiken haben, können Sie zum Beispiel die Rangsumme z-testen, um festzustellen, ob der Unterschied zwischen den beiden Gruppen statistisch signifikant ist (ich glaube, das ist der Wilcoxon-Rangsummentest , der austauschbar ist, dh funktionell entspricht dem Mann-Whitney-U-Test).
R Funktionen für diese Statistiken (die ich sowieso kenne):
wilcox.test in der Standard-R-Installation
meanranks in der Kurbel Paket
quelle
Basierend auf dem Abstract Dieser Artikel kann hilfreich sein, um mehrere Variablen der Likert-Skala zu vergleichen. Es werden zwei Arten von nichtparametrischen Mehrfachvergleichstests verglichen: Einer basierend auf Rängen und einer basierend auf einem Test von Chacko. Es enthält Simulationen.
quelle
Normalerweise verwende ich gerne Mosaic Plot. Sie können sie erstellen, indem Sie andere interessante Kovariaten einbeziehen (z. B. Geschlecht, geschichtete Faktoren usw.).
quelle
Ich stimme Jeromy Anglims Einschätzung zu. Denken Sie daran, dass Likert-Antworten Schätzungen sind. Sie verwenden kein absolut zuverlässiges Lineal, um ein physisches Objekt mit stabilen Abmessungen zu messen. Der Mittelwert ist ein aussagekräftiges Maß für die Verwendung angemessener Stichprobengrößen.
In der Unternehmens- und Produktentwicklung ist der Mittelwert die bei Likert-Waagen mit Abstand am häufigsten verwendete Statistik. Bei der Verwendung von Likert-Skalen habe ich in der Regel ein Maß gewählt, das ideal zur Fragestellung passt. Wenn Sie beispielsweise von "Präferenzen" oder "Einstellungen" sprechen, können Sie mehrere Likert-basierte Indikatoren verwenden, wobei jeder Indikator etwas andere Einsichten bietet.
quelle
"Box Scores" werden häufig verwendet, um Ordnungsdaten zusammenzufassen, insbesondere wenn es sich um aussagekräftige verbale Anker handelt. Mit anderen Worten, Sie können "Top-2-Box" angeben, also den Prozentsatz, für den "Zustimmen" oder "stark zustimmen" ausgewählt wurde.
quelle