Ich habe an einer Reihe von Stellen gelesen, dass die Berechnung des Mittelwerts einer Ordnungszahl ungeeignet ist. Ich versuche, eine Vorstellung davon zu bekommen, warum es unangemessen sein könnte. Ich denke, das liegt daran, dass eine Ordinalvariable im Allgemeinen nicht normal verteilt ist und die Berechnung des Mittelwerts daher eine ungenaue Darstellung ergibt. Könnte jemand eine genauere Begründung geben, warum die Berechnung des Mittelwerts einer Ordnungszahl ungeeignet sein könnte?
mean
ordinal-data
Luciano
quelle
quelle
Antworten:
Eine kurze Antwort ist, dass dies umstritten ist. Entgegen dem von Ihnen angesprochenen Rat nehmen Menschen in vielen Bereichen Mittelwerte und sind oft froh, dass sie das tun, was sie wollen. Ein Beispiel sind Notendurchschnitte oder ähnliche Werte in vielen Bildungssystemen.
Ordnungsdaten, die nicht normal verteilt sind, sind jedoch kein gültiger Grund, da dies der Mittelwert ist
weit verbreitet für nicht normale Distributionen
mathematisch gut definiert für sehr viele nicht normale Verteilungen, außer in einigen pathologischen Fällen.
Es ist möglicherweise keine gute Idee, den Mittelwert in der Praxis zu verwenden, wenn Daten definitiv nicht normal verteilt sind, aber das ist anders.
Ein stärkerer Grund, den Mittelwert nicht mit Ordnungsdaten zu verwenden, besteht darin, dass sein Wert von den Kodierungskonventionen abhängt. Numerische Codes wie 1, 2, 3, 4 werden normalerweise nur aus Gründen der Einfachheit oder Bequemlichkeit gewählt, aber im Prinzip könnten sie genauso gut 1, 23, 456, 7890 sein, soweit dies einer bestimmten Reihenfolge entspricht. Den Mittelwert zu nehmen würde in beiden Fällen bedeuten, diese Konventionen wörtlich zu nehmen (als ob die Zahlen nicht willkürlich, sondern gerechtfertigt wären), und es gibt keinen strengen Grund, dies zu tun. Sie benötigen eine Intervallskala, in der gleiche Differenzen zwischen Werten wörtlich genommen werden können, um die Verwendung von Mitteln zu rechtfertigen. Das nehme ich als Hauptargument an, aber wie bereits angedeutet, ignorieren die Leute es oft und absichtlich, weil sie Mittel nützlich finden, was auch immer Messtheoretiker sagen.
Hier ist ein extra Beispiel. Oft werden die Leute gebeten, eines von "stimme überhaupt nicht zu" zu wählen ... "stimme voll zu" und (abhängig davon, was die Software will) die Forscher als 1 .. 5 oder 0 .. 4 oder was auch immer sie wollen, zu kodieren oder zu deklarieren als geordneter Faktor (oder welcher Begriff auch immer von der Software verwendet wird). Hier ist die Codierung willkürlich und für die Personen, die die Frage beantworten, nicht sichtbar.
Aber oft werden auch Leute auf einer Skala von 1 bis 5 gefragt (sagen wir mal), wie bewerten Sie etwas? Beispiele gibt es zuhauf: Websites, Sport, andere Arten von Wettbewerben und in der Tat Bildung. Hier wird den Menschen eine Waage gezeigt und gebeten, diese zu benutzen. Es ist allgemein bekannt, dass Nicht-Ganzzahlen sinnvoll sind, aber Sie dürfen nur Ganzzahlen als Konvention verwenden. Ist diese Ordnungsskala? Manche sagen ja, manche sagen nein. Andernfalls besteht ein Teil des Problems darin, dass die Ordnungsskala selbst ein unscharfer oder umstrittener Bereich ist.
Betrachten Sie noch einmal Noten für akademische Arbeiten, sagen Sie E bis A. Oft werden solche Noten auch numerisch behandelt, sagen Sie 1 bis 5, und die Leute berechnen routinemäßig Durchschnittswerte für Schüler, Kurse, Schulen usw. und führen weitere Analysen solcher Daten durch. Zwar ist jede Zuordnung zu numerischen Bewertungen zwar willkürlich, aber akzeptabel, solange die Reihenfolge erhalten bleibt. In der Praxis wissen diejenigen, die die Noten vergeben und erhalten, dass die Noten numerische Äquivalente haben und dass die Noten gemittelt werden .
Ein pragmatischer Grund für die Verwendung von Mitteln ist, dass Mediane und Modi häufig schlechte Zusammenfassungen der Informationen in den Daten sind. Angenommen, Sie haben eine Skala, die stark von Uneinigkeit abweicht, um die Punkte 1 bis 5 eindeutig zu stimmen, und der Einfachheit halber codieren Sie diese Punkte Ihre Hände, wenn Sie der Meinung sind, dass der Median und der Modus die einzigen gerechtfertigten Zusammenfassungen sind, da es sich um eine Ordnungsskala handelt. Heben Sie jetzt Ihre Hände, wenn Sie den Mittelwert ebenfalls nützlich finden, unabhängig davon, ob die Summen gut definiert sind usw.
Natürlich wäre der Mittelwert eine hypersensitive Zusammenfassung, wenn die Codes beispielsweise die Quadrate oder Würfel von 1 bis 5 wären, und das ist möglicherweise nicht das, was Sie wollen. (Wenn Sie Überflieger schnell identifizieren möchten, ist dies möglicherweise genau das, was Sie möchten!) Genau deshalb ist die konventionelle Codierung mit aufeinanderfolgenden Ganzzahlcodes eine praktische Wahl, da sie in der Praxis häufig recht gut funktioniert. Dies ist kein Argument, das für Messtheoretiker von Belang ist oder sein sollte, aber Datenanalysten sollten daran interessiert sein, informationsreiche Zusammenfassungen zu erstellen.
Ich stimme jedem zu, der sagt: Nutze die gesamte Verteilung der Klassenhäufigkeiten, aber darum geht es nicht.
quelle
Nehmen wir an, wir nehmen ordinale Werte, z. B. 1, um überhaupt nicht zuzustimmen, 2, um überhaupt nicht zuzustimmen, 3, um zuzustimmen, und 4, um überhaupt zuzustimmen. Wenn vier Personen die Antworten 1,2,3 und 4 geben, was wäre dann der Mittelwert? Es ist (1 + 2 + 3 + 4) / 4 = 2,50.
Wie ist das zu interpretieren, wenn die durchschnittliche Antwort von vier Personen "nicht einverstanden oder einverstanden" ist? Deshalb sollten wir keine Mittelwerte für ordinale Daten verwenden.
quelle
Ich stimme voll und ganz mit @Azeem überein. Aber nur um diesen Punkt nach Hause zu fahren, möchte ich etwas näher darauf eingehen.
Nehmen wir an, Sie haben Ordnungsdaten wie im Beispiel von @Azeem, wo Ihre Skala von 1 bis 4 reicht. Nehmen wir auch an, Sie haben ein paar Leute, die etwas (wie Eiscreme) auf dieser Skala bewerten. Stellen Sie sich vor, Sie erhalten die folgenden Ergebnisse:
Wenn Sie die Ergebnisse interpretieren möchten, können Sie Folgendes feststellen:
Sie wissen jedoch nichts über die Intervalle zwischen den Bewertungen. Ist der Unterschied zwischen 1 und 2 der gleiche wie der zwischen 3 und 4? Bedeutet eine Bewertung von 4 wirklich, dass die Person Eis 4-mal mehr mag als jemand, der es mit 1 bewertet? Und so weiter ... Wenn Sie den arithmetischen Mittelwert berechnen, behandeln Sie die Zahlen so, als ob die Unterschiede zwischen ihnen gleich wären. Aber das ist eine ziemlich starke Annahme bei ordinalen Daten, und Sie müssten sie rechtfertigen.
quelle
Ich stimme dem Konzept zu, dass das arithmetische Mittel in Ordnungsskalendaten nicht wirklich gerechtfertigt werden kann. Anstatt den Mittelwert zu berechnen, können wir in solchen Situationen den Modus oder den Median verwenden, um eine aussagekräftigere Interpretation unserer Ergebnisse zu erhalten.
quelle