Anzeigen von Ordnungsdaten - Mittelwerte, Mediane und mittlere Ränge

11

Ich habe einige Ordnungsdaten, die nicht normal verteilt sind, daher habe ich beschlossen, nichtparametrische Tests mit dem Mann-Whitney-U-Test durchzuführen. Ich betrachte Unterschiede zwischen Gruppen für sieben Punkte - diese Punkte sind entweder 0, 1, 2 oder 3 für jedes Fach. Es fällt mir schwer herauszufinden, wie ich meine Daten anzeigen soll!

Wenn ich die Daten unter Verwendung der Mediane (und des IQR der Mediane) präsentiere, ist überhaupt nicht klar, wo die Unterschiede liegen, da die Mediane größtenteils entweder auf 0 oder 1 fallen. Obwohl der Mann-Whitney-U-Test signifikante Unterschiede zeigt, Der Tisch sieht einfach uninteressant aus.

Ich könnte die Daten auch mit den Mitteln präsentieren . Es gibt einige wissenschaftliche Artikel, die besagen, dass Sie Mittelwerte mit Ordnungsdaten verwenden können, aber dass Sie nicht die gleichen Annahmen über Unterschiede zwischen Punktzahlen treffen können (z. B. ist der Unterschied zwischen 0 und 1 nicht der gleiche wie zwischen 1 und 2). Der Einsatz von Mitteln wäre etwas umstritten, obwohl die Zahlen in der Tabelle die Geschichte gut erzählen, wenn ich sie benutze.

Eine dritte Option ist die Verwendung der mittleren Ränge , die SPSS mir bei der Ausgabe des Mann-Whitney gibt. Die mittleren Ränge sind die, die zwischen Gruppen verglichen werden. Vielleicht sollte ich diese einfach verwenden? Das einzige Problem, das ich damit habe, ist, dass die mittleren Ränge in Bezug auf die tatsächlichen Daten nichts wirklich bedeuten (z. B. kann ich nicht sehen, dass die Probanden näher an einer 3 liegen, während die Kontrollen mit den mittleren Rängen näher an einer 1 liegen.)

Eine letzte Option war die Durchführung einer Chi-Quadrat-Analyse, bei der Probanden und Kontrollen verglichen wurden, nachdem die Ergebnisse in zwei Gruppen aufgeteilt wurden (0 und 1 für niedrig und 2 und 3 für hoch). Als ich dies tat, waren die Unterschiede jedoch nicht so ausgeprägt (wahrscheinlich aus einer Reihe von Gründen).

Eric
quelle
Fragen Sie sich, wie Sie Ihre Daten am besten in Text, Tabelle oder Abbildung darstellen können?
Gung - Reinstate Monica
Sowohl Text als auch Tabelle. Im Text werde ich sagen, dass es bei mehreren Komponenten meiner Schlafumfrage signifikante Unterschiede zwischen den Gruppen gab. Diese Unterschiede werden durch einen Mann-Whitney-Test ermittelt, sodass die mittleren Ränge verglichen werden. Was ich nicht weiß, ist, wie ich diese Unterschiede in einer Tabelle darstellen soll. Die Verwendung von Medianen funktioniert nicht, da sie viel zu ähnlich sind und Sie die Unterschiede nicht erkennen können. Mittel funktionieren besser, aber es scheint seltsam, parametrische Kennzahlen in einer Tabelle zu verwenden, in der es um nichtparametrische Mediane gehen sollte. Und mittlere Ränge würden funktionieren, aber sie repräsentieren keine tatsächlichen Werte.
Eric
1
Ich frage mich, ob einige Antworten von Graph für die Beziehung zwischen zwei Ordnungsvariablen für Ihre Zwecke angepasst werden könnten. Die Beispieldiagramme zeigen die Beziehung zwischen zwei Variablen mit jeweils fünf Ebenen. Wenn Sie jedoch z. B. zwei Gruppen vergleichen und vier mögliche Ebenen haben, können Sie sich einige dieser Visualisierungen als 4-mal-2 statt 5-mal-2 vorstellen. 5 vielleicht.
Silverfish
Es kann hilfreich sein, wenn Sie einige (möglicherweise völlig falsche) Beispieldaten veröffentlichen, damit Personen, die eine mögliche Technik demonstrieren möchten, etwas zum Arbeiten haben.
Silverfish
1
Eric, per Definition ein nichtparametrischer Test, insbesondere Mann-Whitney, vergleicht (für die Dominanz) zwei Verteilungen im Allgemeinen, er vergleicht keinen bestimmten Parameterwert einer Verteilung, wie z. B. Mittelwert oder Median. Es gibt keine einzige Zahl, die für eine Verteilung charakteristisch ist und gleichzeitig in diesem Fall verglichen wird. Sie können den Hodges-Lehmann-Schätzer mit zwei Stichproben verwenden, dies ist jedoch das Merkmal des Unterschieds zwischen zwei Verteilungen und nicht jeder der beiden Verteilungen.
ttnphns

Antworten:

8

Dies ist eine ausgezeichnete Frage. Wie Sie festgestellt haben, funktionieren Quantile nicht, wenn die Daten viele Verknüpfungen aufweisen, da sie als Schätzer zu diskontinuierlich sind. Ich finde oft, dass Mittel am besten funktionieren, wenn man davon ausgehen kann, dass der Abstand zwischen den Kategorien mindestens "halbwegs aussagekräftig" ist. Überschreitungswahrscheinlichkeiten sind immer gültig. In Ihrem Fall würden diese durch den Anteil der Beobachtungen geschätzt1,2,=3. Mittlere Ränge sind nützlich, wenn man Gruppen vergleicht, aber ich sehe nicht so viel Nutzen für eine einzelne Variable.

Die Richtigkeit der Verwendung des Mittelwerts zur Zusammenfassung von Ordnungsvariablen kann selten aus den Daten selbst stammen. Es ist subjektiv.

Anstatt mittlere Ränge zu verwenden, würde ich ein geeignetes Rangkorrelationsmaß oder die Konkordanzwahrscheinlichkeit (eine einfache lineare Übersetzung der Wilcoxon-Mann-Whitney-Statistik; es ist der mittlere Rang der Beobachtungen in einer der beiden durch eine Konstante geteilten Gruppen) zwischen verwenden zwei Variablen (z. B. eine binäre Gruppierung und eine Ordnungsskala). Zur Auswahl der Korrelationskoeffizienten gehören Somers 'D.xy (was mit der Konkordanzwahrscheinlichkeit übereinstimmt und für Bindungen an die Ordnungsvariable bestraft wird) und Goodman-Kruskal γ was auch nicht für Krawatten bestraft x oder y.

Frank Harrell
quelle
1
Hallo Frank, danke für deine nachdenkliche Antwort. Wenn es Ihnen nichts ausmacht, habe ich ein paar Anschlussfragen. In Bezug auf die Mittel - Ich glaube, die Kategorien sind mindestens zur Hälfte aussagekräftig, da sie sich im Wesentlichen auf "keine, leichte, mittelschwere bzw. schwere Beeinträchtigung" beziehen. Gibt es Referenzen, von denen Sie wissen, dass ich sie möglicherweise als Präzedenzfall dafür verwenden kann? Ich zögere auch, Mittel in nur einer Tabelle und Mediane in anderen aus Gründen der Konsistenz zu verwenden. UND für mittlere Ränge - ich glaube, ich vergleiche Gruppen - Probanden gegen Kontrollen mit 7 Punkten. Ist der Vergleich der mittleren Ränge akzeptabel / nützlich?
Eric
Für numerische Ordnungsdaten mit wenigen Ebenen, wie z. B. Zählungen und möglicherweise Ihr Beispiel für eine Beeinträchtigung, sind Mittelwerte nützlich und Mediane nicht (aufgrund zu vieler Bindungen). Es gibt viele Fälle, in denen ich Mittelwerte für Ordnungsdaten und Mediane für verzerrte kontinuierliche Daten in derselben Tabelle verwendet habe.
Frank Harrell