Berechnen Sie den Mittelwert der Ordnungszahl

20

Ich habe an einer Reihe von Stellen gelesen, dass die Berechnung des Mittelwerts einer Ordnungszahl ungeeignet ist. Ich versuche, eine Vorstellung davon zu bekommen, warum es unangemessen sein könnte. Ich denke, das liegt daran, dass eine Ordinalvariable im Allgemeinen nicht normal verteilt ist und die Berechnung des Mittelwerts daher eine ungenaue Darstellung ergibt. Könnte jemand eine genauere Begründung geben, warum die Berechnung des Mittelwerts einer Ordnungszahl ungeeignet sein könnte?

Luciano
quelle
8
Um einen Mittelwert zu berechnen, benötigen Sie zunächst eine Summe. Damit eine Summe aussagekräftig ist, muss 4 + 2 mit 3 + 3 identisch sein. entsprechend benötigen Sie 4-3 = 3-2 = 2-1. Bei ordinalen Daten - auch wenn ihre Kategorien mit "1", "2", "3", "4" gekennzeichnet sind - ist dies (ganz explizit) nicht unbedingt der Fall.
Glen_b
Und warum ist der Median geeigneter als das arithmetische Mittel?

Antworten:

24

Eine kurze Antwort ist, dass dies umstritten ist. Entgegen dem von Ihnen angesprochenen Rat nehmen Menschen in vielen Bereichen Mittelwerte und sind oft froh, dass sie das tun, was sie wollen. Ein Beispiel sind Notendurchschnitte oder ähnliche Werte in vielen Bildungssystemen.

Ordnungsdaten, die nicht normal verteilt sind, sind jedoch kein gültiger Grund, da dies der Mittelwert ist

  • weit verbreitet für nicht normale Distributionen

  • mathematisch gut definiert für sehr viele nicht normale Verteilungen, außer in einigen pathologischen Fällen.

Es ist möglicherweise keine gute Idee, den Mittelwert in der Praxis zu verwenden, wenn Daten definitiv nicht normal verteilt sind, aber das ist anders.

Ein stärkerer Grund, den Mittelwert nicht mit Ordnungsdaten zu verwenden, besteht darin, dass sein Wert von den Kodierungskonventionen abhängt. Numerische Codes wie 1, 2, 3, 4 werden normalerweise nur aus Gründen der Einfachheit oder Bequemlichkeit gewählt, aber im Prinzip könnten sie genauso gut 1, 23, 456, 7890 sein, soweit dies einer bestimmten Reihenfolge entspricht. Den Mittelwert zu nehmen würde in beiden Fällen bedeuten, diese Konventionen wörtlich zu nehmen (als ob die Zahlen nicht willkürlich, sondern gerechtfertigt wären), und es gibt keinen strengen Grund, dies zu tun. Sie benötigen eine Intervallskala, in der gleiche Differenzen zwischen Werten wörtlich genommen werden können, um die Verwendung von Mitteln zu rechtfertigen. Das nehme ich als Hauptargument an, aber wie bereits angedeutet, ignorieren die Leute es oft und absichtlich, weil sie Mittel nützlich finden, was auch immer Messtheoretiker sagen.

Hier ist ein extra Beispiel. Oft werden die Leute gebeten, eines von "stimme überhaupt nicht zu" zu wählen ... "stimme voll zu" und (abhängig davon, was die Software will) die Forscher als 1 .. 5 oder 0 .. 4 oder was auch immer sie wollen, zu kodieren oder zu deklarieren als geordneter Faktor (oder welcher Begriff auch immer von der Software verwendet wird). Hier ist die Codierung willkürlich und für die Personen, die die Frage beantworten, nicht sichtbar.

Aber oft werden auch Leute auf einer Skala von 1 bis 5 gefragt (sagen wir mal), wie bewerten Sie etwas? Beispiele gibt es zuhauf: Websites, Sport, andere Arten von Wettbewerben und in der Tat Bildung. Hier wird den Menschen eine Waage gezeigt und gebeten, diese zu benutzen. Es ist allgemein bekannt, dass Nicht-Ganzzahlen sinnvoll sind, aber Sie dürfen nur Ganzzahlen als Konvention verwenden. Ist diese Ordnungsskala? Manche sagen ja, manche sagen nein. Andernfalls besteht ein Teil des Problems darin, dass die Ordnungsskala selbst ein unscharfer oder umstrittener Bereich ist.

Betrachten Sie noch einmal Noten für akademische Arbeiten, sagen Sie E bis A. Oft werden solche Noten auch numerisch behandelt, sagen Sie 1 bis 5, und die Leute berechnen routinemäßig Durchschnittswerte für Schüler, Kurse, Schulen usw. und führen weitere Analysen solcher Daten durch. Zwar ist jede Zuordnung zu numerischen Bewertungen zwar willkürlich, aber akzeptabel, solange die Reihenfolge erhalten bleibt. In der Praxis wissen diejenigen, die die Noten vergeben und erhalten, dass die Noten numerische Äquivalente haben und dass die Noten gemittelt werden .

Ein pragmatischer Grund für die Verwendung von Mitteln ist, dass Mediane und Modi häufig schlechte Zusammenfassungen der Informationen in den Daten sind. Angenommen, Sie haben eine Skala, die stark von Uneinigkeit abweicht, um die Punkte 1 bis 5 eindeutig zu stimmen, und der Einfachheit halber codieren Sie diese Punkte Ihre Hände, wenn Sie der Meinung sind, dass der Median und der Modus die einzigen gerechtfertigten Zusammenfassungen sind, da es sich um eine Ordnungsskala handelt. Heben Sie jetzt Ihre Hände, wenn Sie den Mittelwert ebenfalls nützlich finden, unabhängig davon, ob die Summen gut definiert sind usw.

Natürlich wäre der Mittelwert eine hypersensitive Zusammenfassung, wenn die Codes beispielsweise die Quadrate oder Würfel von 1 bis 5 wären, und das ist möglicherweise nicht das, was Sie wollen. (Wenn Sie Überflieger schnell identifizieren möchten, ist dies möglicherweise genau das, was Sie möchten!) Genau deshalb ist die konventionelle Codierung mit aufeinanderfolgenden Ganzzahlcodes eine praktische Wahl, da sie in der Praxis häufig recht gut funktioniert. Dies ist kein Argument, das für Messtheoretiker von Belang ist oder sein sollte, aber Datenanalysten sollten daran interessiert sein, informationsreiche Zusammenfassungen zu erstellen.

Ich stimme jedem zu, der sagt: Nutze die gesamte Verteilung der Klassenhäufigkeiten, aber darum geht es nicht.

Nick Cox
quelle
1
Eine gute Antwort und Pragmatismus sind wichtig, aber ich möchte einen Hinweis zur Vorsicht hinzufügen. Ein guter Grund, nur formal etablierte Methoden zu verwenden, ist, dass Sie Zugang zu Schätzungen der Sicherheit erhalten. Wenn wir zum Beispiel zwei GPAs haben, sagen wir 4.53 und 4.34, möchten wir vielleicht wissen, ob einer "signifikant" besser ist als der andere. Aufgrund des Mangels an Formalitäten bei der Mittelung der Noten erhalten wir jedoch keine Konfidenzintervalle usw.
Stephen McAteer
1
@StephenMcAteer Ich sehe Ihren Standpunkt in Bezug auf die Methoden, die in einem typischen Einführungstext oder Kurs vermittelt werden. Aber wenn das der Wunsch wäre, bietet Bootstrapping eine Technologie, die seit fast 40 Jahren Vertrauensintervalle zulässt.
Nick Cox
3

Nehmen wir an, wir nehmen ordinale Werte, z. B. 1, um überhaupt nicht zuzustimmen, 2, um überhaupt nicht zuzustimmen, 3, um zuzustimmen, und 4, um überhaupt zuzustimmen. Wenn vier Personen die Antworten 1,2,3 und 4 geben, was wäre dann der Mittelwert? Es ist (1 + 2 + 3 + 4) / 4 = 2,50.

Wie ist das zu interpretieren, wenn die durchschnittliche Antwort von vier Personen "nicht einverstanden oder einverstanden" ist? Deshalb sollten wir keine Mittelwerte für ordinale Daten verwenden.

SAAN
quelle
3
Wenn ich den Anwalt des Teufels ein wenig spiele, würde ich in diesem Beispiel 2.5 so interpretieren, dass es auf halber Strecke zwischen 2, "nicht einverstanden" und 3, "einverstanden" liegt. Dies ist als Durchschnitt sinnvoll, da wir "stark nicht einverstanden" oder "stark einverstanden" und "nicht einverstanden" oder "einverstanden" haben.
TooTone
1
Ein Mittelwert von 2,5 ist in diesem Zusammenhang für mich immer noch sinnvoll - auf halbem Weg zwischen Nichtübereinstimmung und Zustimmung oder mit anderen Worten neutral.
Luciano
3
Ich denke, Azeem braucht ein stärkeres Beispiel. Man könnte 2,5 als Durchschnitt von 1, 2, 3, 4 Kindern pro Familie aus dem gleichen Grund ablehnen, wie ist das zu interpretieren, da es sich nicht um einen der definierten Werte handelt. Das wirft verschiedene Fragen auf.
Nick Cox
2
Ich denke, Sie können Ihre Antwort stärken und ich ermutige Sie, dies zu tun. "weil der Mittelwert ein undefinierter Wert sein könnte" ist hier weder logisch noch psychologisch ein starkes Argument und konzentriert sich nicht auf die tiefere Frage, ob gleiche Unterschiede wirklich gleiche Unterschiede bedeuten.
Nick Cox
1
Ich weiß nicht, wie ich es klarer machen kann, aber (zB) "0-4", "5-19", "20-114" sind (ordinal), da es nur eine natürliche Reihenfolge für diese Messungen gibt (kurz vor der Umkehrung). Wenn du sie auch andere Dinge nennen willst, ist das in Ordnung für mich.
Nick Cox
2

Ich stimme voll und ganz mit @Azeem überein. Aber nur um diesen Punkt nach Hause zu fahren, möchte ich etwas näher darauf eingehen.

Nehmen wir an, Sie haben Ordnungsdaten wie im Beispiel von @Azeem, wo Ihre Skala von 1 bis 4 reicht. Nehmen wir auch an, Sie haben ein paar Leute, die etwas (wie Eiscreme) auf dieser Skala bewerten. Stellen Sie sich vor, Sie erhalten die folgenden Ergebnisse:

  • Person A sagte 4
  • Person B sagte 3
  • Person C sagte 1
  • Person D sagte 2

Wenn Sie die Ergebnisse interpretieren möchten, können Sie Folgendes feststellen:

  • Person A mochte Eis mehr als Person B
  • Person D mochte Eis mehr als Person C.

Sie wissen jedoch nichts über die Intervalle zwischen den Bewertungen. Ist der Unterschied zwischen 1 und 2 der gleiche wie der zwischen 3 und 4? Bedeutet eine Bewertung von 4 wirklich, dass die Person Eis 4-mal mehr mag als jemand, der es mit 1 bewertet? Und so weiter ... Wenn Sie den arithmetischen Mittelwert berechnen, behandeln Sie die Zahlen so, als ob die Unterschiede zwischen ihnen gleich wären. Aber das ist eine ziemlich starke Annahme bei ordinalen Daten, und Sie müssten sie rechtfertigen.

Jens Kouros
quelle
Ich habe den Verweis auf die Antwort oben herausgeschnitten. Die Reihenfolge der Antworten kann sich ändern, und tatsächlich ist die Antwort, die oben war, in diesem Moment unten, und das kann sich ändern. Verweisen Sie also auf Plakate, nicht auf die Position.
Nick Cox
0

Ich stimme dem Konzept zu, dass das arithmetische Mittel in Ordnungsskalendaten nicht wirklich gerechtfertigt werden kann. Anstatt den Mittelwert zu berechnen, können wir in solchen Situationen den Modus oder den Median verwenden, um eine aussagekräftigere Interpretation unserer Ergebnisse zu erhalten.

Ayaz
quelle
Hiermit wird nicht die Frage beantwortet, warum dies möglicherweise unangemessen ist.
Nick Cox