Ich habe einige Ordnungsdaten, die nicht normal verteilt sind, daher habe ich beschlossen, nichtparametrische Tests mit dem Mann-Whitney-U-Test durchzuführen. Ich betrachte Unterschiede zwischen Gruppen für sieben Punkte - diese Punkte sind entweder 0, 1, 2 oder 3 für jedes Fach. Es fällt mir schwer herauszufinden, wie ich meine Daten anzeigen soll!
Wenn ich die Daten unter Verwendung der Mediane (und des IQR der Mediane) präsentiere, ist überhaupt nicht klar, wo die Unterschiede liegen, da die Mediane größtenteils entweder auf 0 oder 1 fallen. Obwohl der Mann-Whitney-U-Test signifikante Unterschiede zeigt, Der Tisch sieht einfach uninteressant aus.
Ich könnte die Daten auch mit den Mitteln präsentieren . Es gibt einige wissenschaftliche Artikel, die besagen, dass Sie Mittelwerte mit Ordnungsdaten verwenden können, aber dass Sie nicht die gleichen Annahmen über Unterschiede zwischen Punktzahlen treffen können (z. B. ist der Unterschied zwischen 0 und 1 nicht der gleiche wie zwischen 1 und 2). Der Einsatz von Mitteln wäre etwas umstritten, obwohl die Zahlen in der Tabelle die Geschichte gut erzählen, wenn ich sie benutze.
Eine dritte Option ist die Verwendung der mittleren Ränge , die SPSS mir bei der Ausgabe des Mann-Whitney gibt. Die mittleren Ränge sind die, die zwischen Gruppen verglichen werden. Vielleicht sollte ich diese einfach verwenden? Das einzige Problem, das ich damit habe, ist, dass die mittleren Ränge in Bezug auf die tatsächlichen Daten nichts wirklich bedeuten (z. B. kann ich nicht sehen, dass die Probanden näher an einer 3 liegen, während die Kontrollen mit den mittleren Rängen näher an einer 1 liegen.)
Eine letzte Option war die Durchführung einer Chi-Quadrat-Analyse, bei der Probanden und Kontrollen verglichen wurden, nachdem die Ergebnisse in zwei Gruppen aufgeteilt wurden (0 und 1 für niedrig und 2 und 3 für hoch). Als ich dies tat, waren die Unterschiede jedoch nicht so ausgeprägt (wahrscheinlich aus einer Reihe von Gründen).
Antworten:
Dies ist eine ausgezeichnete Frage. Wie Sie festgestellt haben, funktionieren Quantile nicht, wenn die Daten viele Verknüpfungen aufweisen, da sie als Schätzer zu diskontinuierlich sind. Ich finde oft, dass Mittel am besten funktionieren, wenn man davon ausgehen kann, dass der Abstand zwischen den Kategorien mindestens "halbwegs aussagekräftig" ist. Überschreitungswahrscheinlichkeiten sind immer gültig. In Ihrem Fall würden diese durch den Anteil der Beobachtungen geschätzt≥ 1 , ≥ 2 , = 3 . Mittlere Ränge sind nützlich, wenn man Gruppen vergleicht, aber ich sehe nicht so viel Nutzen für eine einzelne Variable.
Die Richtigkeit der Verwendung des Mittelwerts zur Zusammenfassung von Ordnungsvariablen kann selten aus den Daten selbst stammen. Es ist subjektiv.
Anstatt mittlere Ränge zu verwenden, würde ich ein geeignetes Rangkorrelationsmaß oder die Konkordanzwahrscheinlichkeit (eine einfache lineare Übersetzung der Wilcoxon-Mann-Whitney-Statistik; es ist der mittlere Rang der Beobachtungen in einer der beiden durch eine Konstante geteilten Gruppen) zwischen verwenden zwei Variablen (z. B. eine binäre Gruppierung und eine Ordnungsskala). Zur Auswahl der Korrelationskoeffizienten gehören Somers 'D.x y (was mit der Konkordanzwahrscheinlichkeit übereinstimmt und für Bindungen an die Ordnungsvariable bestraft wird) und Goodman-Kruskal γ was auch nicht für Krawatten bestraft x oder y .
quelle