Was sind gute Basisstatistiken für Ordnungsdaten?

67

Ich habe einige ordinale Daten aus Umfragefragen erhalten. In meinem Fall handelt es sich um Likert- Antworten (stimme überhaupt nicht zu, stimme überhaupt nicht zu, sei neutral, stimme voll und ganz zu). In meinen Daten sind sie als 1-5 codiert.

Ich glaube nicht, dass Mittel hier viel bedeuten würden. Welche grundlegenden Zusammenfassungsstatistiken werden als nützlich erachtet?

descriptive-statistics likert ordinal-data PaulHurleyuk
quelle

2

Häufige Auswahlmöglichkeiten sind - Mediane, Modi, Proportionen oder kumulative Proportionen in jeder Gruppe

Glen_b

29

Eine Frequenztabelle ist ein guter Ausgangspunkt. Sie können die Zählung und die relative Häufigkeit für jedes Level vornehmen. Außerdem können die Gesamtzahl und die Anzahl der fehlenden Werte hilfreich sein.

Sie können auch eine Kontingenztabelle verwenden, um zwei Variablen gleichzeitig zu vergleichen. Kann auch mithilfe eines Mosaikplots angezeigt werden.

Neil McGuigan
quelle

32

Ich werde aus einer angewandten Perspektive argumentieren, dass der Mittelwert oft die beste Wahl ist, um die zentrale Tendenz eines Likert-Gegenstands zusammenzufassen. Insbesondere denke ich an Kontexte wie Umfragen zur Schülerzufriedenheit, Marktforschungsskalen, Mitarbeiterumfragen, Persönlichkeitstests und viele sozialwissenschaftliche Umfragen.

In solchen Kontexten möchten Verbraucher von Forschung häufig Antworten auf Fragen wie:

Welche Aussagen stimmen mehr oder weniger mit anderen überein?
Welche Gruppen stimmten einer Aussage mehr oder weniger zu?
Ist die Übereinstimmung im Laufe der Zeit gestiegen oder gesunken?

Für diese Zwecke hat der Mittelwert mehrere Vorteile:

1. Der Mittelwert ist einfach zu berechnen:

Die Beziehung zwischen den Rohdaten und dem Mittelwert ist leicht zu erkennen.
Es ist pragmatisch einfach zu berechnen. Somit kann der Mittelwert leicht in Berichtssysteme eingebettet werden.
Es erleichtert auch die Vergleichbarkeit zwischen Kontexten und Einstellungen.

2. Mean ist relativ gut verstanden und intuitiv:

Der Mittelwert wird häufig verwendet, um die zentrale Tendenz von Likert-Artikeln zu melden. Daher ist es für Konsumenten von Forschung wahrscheinlicher, den Mittelwert zu verstehen (und ihm zu vertrauen und danach zu handeln).
Einige Forscher bevorzugen die wohl noch intuitivere Möglichkeit, den Prozentsatz der Stichprobe mit 4 oder 5 zu melden. Im Wesentlichen ist dies nur eine alternative Form des Mittels mit 0, 0, 0, 1, 1Codierung.
Im Laufe der Zeit bauen die Konsumenten von Forschungsergebnissen Referenzrahmen auf. Wenn Sie beispielsweise Ihre Unterrichtsleistung von Jahr zu Jahr oder fächerübergreifend vergleichen, können Sie differenziert nachvollziehen, was ein Mittelwert von 3,7, 3,9 oder 4,1 bedeutet.

3. Der Mittelwert ist eine einzelne Zahl:

Eine einzelne Zahl ist besonders wertvoll, wenn Sie Behauptungen aufstellen möchten, dass "die Schüler mit dem Fach X zufriedener waren als mit dem Fach Y."
Ich finde auch empirisch, dass eine einzelne Zahl tatsächlich die Hauptinformation von Interesse in einem Likert-Gegenstand ist. Die Standardabweichung hängt in der Regel davon ab, inwieweit der Mittelwert in der Nähe der zentralen Punktzahl liegt (z. B. 3,0). Aus empirischen Gründen trifft dies in Ihrem Kontext möglicherweise nicht zu. Ich habe zum Beispiel irgendwo gelesen, dass es bei You Tube-Bewertungen mit dem Sternensystem eine große Anzahl von entweder der niedrigsten oder der höchsten Bewertung gab. Aus diesem Grund ist es wichtig, die Kategorienfrequenzen zu überprüfen.

4. Es macht keinen großen Unterschied

Obwohl ich es nicht offiziell getestet habe, würde ich die Hypothese aufstellen, dass zum Zweck des Vergleichs der zentralen Tendenzbewertungen über Punkte oder Gruppen von Teilnehmern oder über die Zeit jede vernünftige Wahl der Skalierung zur Erzeugung des Mittelwerts ähnliche Schlussfolgerungen liefern würde.

Jeromy Anglim
quelle

4

Netter Post! Haben Sie irgendwelche Gedanken darüber, wie verschiedene Kulturen / Länder Likert-Skalen verwenden könnten, die sich drastisch auf diese Art von Ergebnissen auswirken würden?

Chase

@chase Es gibt Nachforschungen darüber, aber es ist schon eine Weile her, seit ich es angeschaut habe. Hier ist ein Beispiel für eine Suche auf Google scholar scholar.google.com.au/…

Jeromy Anglim

Ich stimme mit Jeromy Anglims Rechtfertigung der Verwendung des Mittelwerts (dh des gewichteten Mittelwerts, um genau zu sein) als der zuverlässigsten, unvoreingenommeneren , deskriptiveren Interpretation geordneter kategorialer Variablen wie der Verwendung der Likert-Skala überein, bei der jeder der Datenpunkte zum beiträgt endgültiger Durchschnitt.

3

Ich stellte die Frage zu kulturellen Unterschieden bei der Verwendung von Antwortskalen auf cogsci.stackexchange.com

Jeromy Anglim

28

Für grundlegende Zusammenfassungen stimme ich zu, dass die Berichterstattung über Häufigkeitstabellen und einige Angaben zur zentralen Tendenz in Ordnung ist. In einem kürzlich in PARE veröffentlichten Artikel wurden t- und MWW-Test, Fünf-Punkte-Likert-Items: t-Test gegen Mann-Whitney-Wilcoxon, diskutiert .

Für eine ausführlichere Behandlung würde ich empfehlen, Agrestis Rezension zu geordneten kategorialen Variablen zu lesen:

Liu, Y und Agresti, A (2005). Die Analyse geordneter kategorialer Daten: Ein Überblick und eine Übersicht über die jüngsten Entwicklungen . Test Sociedad de Estadística e Investigación Operativa , 14 (1), 1-73.

Es geht weit über die üblichen Statistiken wie Schwellenwertmodelle (z. B. Proportional Odds Ratio) hinaus und ist eine Lektüre anstelle von Agrestis CDA- Buch wert .

Im Folgenden zeige ich ein Bild von drei verschiedenen Möglichkeiten, einen Likert-Gegenstand zu behandeln. von oben nach unten die "Frequenz" -Ansicht (nominal), die "numerische" Ansicht und die "probabilistische" Ansicht (ein Teilkreditmodell ):

Alt-Text

Die Daten stammen aus den ScienceDaten in dem ltmPaket, in dem sich der Gegenstand auf die Technologie bezieht ("Neue Technologie hängt nicht von der wissenschaftlichen Grundlagenforschung ab", mit der Antwort "trifft überhaupt nicht zu", "trifft voll zu", auf einer Vier-Punkte-Skala).

chl
quelle

14

Üblicherweise werden zur Beschreibung von Ordnungsdaten die Rangsumme und der Mittelwert der nichtparametrischen Statistik verwendet.

So funktionieren sie:

Rang Summe

Weisen Sie jedem Mitglied in jeder Gruppe einen Rang zu.
Angenommen, Sie sehen sich die Tore für jeden Spieler in zwei gegnerischen Fußballmannschaften an und ordnen dann jedes Mitglied von Anfang bis Ende in beiden Mannschaften.
Berechnen Sie die Rangfolge, indem Sie die Ränge pro Gruppe addieren .
Die Größe der Rangsumme gibt an, wie eng die Ränge für jede Gruppe zusammenliegen

Mittlerer Rang

M / R ist eine komplexere Statistik als R / S, da es ungleiche Größen in den Gruppen ausgleicht, die Sie vergleichen. Daher dividieren Sie zusätzlich zu den obigen Schritten jede Summe durch die Anzahl der Mitglieder in der Gruppe.

Sobald Sie diese beiden Statistiken haben, können Sie zum Beispiel die Rangsumme z-testen, um festzustellen, ob der Unterschied zwischen den beiden Gruppen statistisch signifikant ist (ich glaube, das ist der Wilcoxon-Rangsummentest , der austauschbar ist, dh funktionell entspricht dem Mann-Whitney-U-Test).

R Funktionen für diese Statistiken (die ich sowieso kenne):

wilcox.test in der Standard-R-Installation

meanranks in der Kurbel Paket

doug
quelle

3

Basierend auf dem Abstract Dieser Artikel kann hilfreich sein, um mehrere Variablen der Likert-Skala zu vergleichen. Es werden zwei Arten von nichtparametrischen Mehrfachvergleichstests verglichen: Einer basierend auf Rängen und einer basierend auf einem Test von Chacko. Es enthält Simulationen.

Peter Flom
quelle

Gegenwärtig scheint dies fast ein Kommentar zu sein, @PeterFlom. Obwohl die digitale Bibliothek von ACM wahrscheinlich weniger anfällig für Links ist, haben Sie etwas dagegen, etwas über den Artikel zu sagen, vielleicht eine Präzisierung der darin enthaltenen hilfreichen Informationen?

gung - Wiedereinsetzung von Monica

2

Hi @gung Ich war mir nicht sicher, wo ich den Kommentar in diesem langen Thread einfügen sollte. Ich habe das Zitat hier hinzugefügt, da die heute gestellte Frage geschlossen wurde und dieser Artikel nützlich zu sein scheint (und Themen abdeckt, die ich an keiner anderen Stelle gesehen habe)

Peter Flom

2

Normalerweise verwende ich gerne Mosaic Plot. Sie können sie erstellen, indem Sie andere interessante Kovariaten einbeziehen (z. B. Geschlecht, geschichtete Faktoren usw.).

Galois-Theorie
quelle

2

Ich stimme Jeromy Anglims Einschätzung zu. Denken Sie daran, dass Likert-Antworten Schätzungen sind. Sie verwenden kein absolut zuverlässiges Lineal, um ein physisches Objekt mit stabilen Abmessungen zu messen. Der Mittelwert ist ein aussagekräftiges Maß für die Verwendung angemessener Stichprobengrößen.

In der Unternehmens- und Produktentwicklung ist der Mittelwert die bei Likert-Waagen mit Abstand am häufigsten verwendete Statistik. Bei der Verwendung von Likert-Skalen habe ich in der Regel ein Maß gewählt, das ideal zur Fragestellung passt. Wenn Sie beispielsweise von "Präferenzen" oder "Einstellungen" sprechen, können Sie mehrere Likert-basierte Indikatoren verwenden, wobei jeder Indikator etwas andere Einsichten bietet.

$i$ $X$

VARNOLD
quelle

1

"Box Scores" werden häufig verwendet, um Ordnungsdaten zusammenzufassen, insbesondere wenn es sich um aussagekräftige verbale Anker handelt. Mit anderen Worten, Sie können "Top-2-Box" angeben, also den Prozentsatz, für den "Zustimmen" oder "stark zustimmen" ausgewählt wurde.

Jonathan
quelle

Was sind gute Basisstatistiken für Ordnungsdaten?

Antworten:

1. Der Mittelwert ist einfach zu berechnen:

2. Mean ist relativ gut verstanden und intuitiv:

3. Der Mittelwert ist eine einzelne Zahl:

4. Es macht keinen großen Unterschied