Wenn ich es richtig verstehe, sind Buchbewertungen auf einer Skala von 1 bis 5 Likert-Bewertungen. Das heißt, eine 3 für mich muss nicht unbedingt eine 3 für einen anderen sein. Es ist eine Ordnungsskala IMO. Man sollte die Ordnungsskalen nicht wirklich mitteln, kann aber definitiv den Modus, den Median und die Perzentile verwenden.
So ist es ‚okay‘ zu beugen die Regeln , da der Großteil der Bevölkerung versteht Mittel als die oben genannten Statistiken? Obwohl die Forschungsgemeinschaft es nachdrücklich ablehnt, Durchschnittswerte von Likert-basierten Daten zu verwenden, ist es in Ordnung, dies mit der Masse zu tun (praktisch)? Ist es in diesem Fall sogar irreführend, den Durchschnitt zu nehmen?
Scheint unwahrscheinlich, dass ein Unternehmen wie Amazon an grundlegenden Statistiken herumfummelt, aber wenn nicht, was fehle ich dann hier? Können wir behaupten, dass die Ordnungsskala eine geeignete Annäherung an die Ordnungszahl ist, um die Mittelwertbildung zu rechtfertigen? Aus welchen Gründen?
quelle
Antworten:
Vorteile der Verwendung des Mittels zur Zusammenfassung der zentralen Tendenz einer 5-Punkte-Bewertung
Wie @gung bereits sagte, gibt es meiner Meinung nach oft gute Gründe, den Mittelwert eines Fünf-Punkte-Punktes als Index für die zentrale Tendenz zu betrachten. Ich habe diese Gründe hier bereits umrissen .
Umschreiben:
Warum ist der Mittelwert gut für Amazon
Denken Sie über die Ziele von Amazon nach, wenn Sie den Mittelwert melden. Sie könnten darauf abzielen
Amazon liefert eine Art gerundeten Mittelwert, Häufigkeitswerte für jede Bewertungsoption und die Stichprobengröße (dh Anzahl der Bewertungen). Vermutlich reichen diese Informationen für die meisten Menschen aus, um sowohl die allgemeine Stimmung in Bezug auf den Artikel als auch das Vertrauen in eine solche Bewertung einzuschätzen (dh 4,5 mit 20 Bewertungen sind wahrscheinlicher als 4,5 mit 2 Bewertungen; ein Artikel mit 10 5 Bewertungen) (Sternebewertungen und eine 1-Sternebewertung ohne Kommentare sind möglicherweise immer noch ein guter Artikel).
Sie könnten den Mittelwert sogar als demokratische Option ansehen. Viele Wahlen werden basierend darauf entschieden, welcher Kandidat auf einer Zwei-Punkte-Skala den höchsten Mittelwert erzielt. Wenn Sie dem Argument folgen, dass jede Person, die eine Bewertung abgibt, eine Bewertung erhält, können Sie den Mittelwert als eine Form ansehen, die die Stimmen jeder Person gleich gewichtet.
Sind Unterschiede in der Skalennutzung wirklich ein Problem?
In der psychologischen Literatur ist eine Vielzahl von Bewertungsverzerrungen bekannt (siehe Saal et al. 1980), wie z. B. zentrale Tendenzverzerrung, Kronzeugenverzerrung, Strengeverzerrung. Außerdem sind einige Bewerter willkürlicher und andere zuverlässiger. Einige mögen sogar systematisch lügen, wenn sie falsch positive oder falsch negative Bewertungen abgeben. Dies führt zu verschiedenen Fehlerarten, wenn versucht wird, die tatsächliche Durchschnittsbewertung für einen Artikel zu berechnen.
Wenn Sie jedoch eine Zufallsstichprobe aus der Bevölkerung ziehen würden, würden sich solche Verzerrungen aufheben, und bei einer ausreichenden Stichprobengröße der Bewerter würden Sie immer noch den wahren Mittelwert erhalten.
Natürlich erhalten Sie bei Amazon keine Zufallsstichprobe, und es besteht das Risiko, dass die bestimmte Gruppe von Bewertern, die Sie für einen Artikel erhalten, systematisch voreingenommen ist, um milder oder strenger zu sein und so weiter. Ich denke jedoch, dass Amazon-Nutzer es zu schätzen wissen, dass von Nutzern eingereichte Bewertungen aus einer unvollständigen Stichprobe stammen. Ich denke auch, dass es ziemlich wahrscheinlich ist, dass bei einer angemessenen Stichprobengröße in vielen Fällen die Mehrheit der Response-Bias-Unterschiede verschwindet.
Mögliche Fortschritte über den Durchschnitt hinaus
In Bezug auf die Verbesserung der Genauigkeit der Bewertung würde ich das allgemeine Konzept des Mittelwerts nicht in Frage stellen, sondern ich denke, dass es andere Möglichkeiten gibt, die tatsächliche Durchschnittsbewertung der Grundgesamtheit für einen Artikel zu schätzen (dh die Durchschnittsbewertung, die erhalten würde) wurden eine große repräsentative Stichprobe gebeten, den Artikel zu bewerten).
Wenn die Genauigkeit der Bewertungen das Hauptziel von Amazon war, sollte es meiner Meinung nach darum gehen, die Anzahl der Bewertungen pro Artikel zu erhöhen und einige der oben genannten Strategien zu übernehmen. Solche Ansätze könnten besonders relevant sein, wenn Sie "Best-of" -Rankings erstellen. Für die bescheidene Bewertung auf der Seite kann es jedoch durchaus sein, dass der Stichprobenmittelwert die Ziele der Einfachheit und Transparenz besser erfüllt.
Verweise
quelle
Um hier etwas technisch zu sein, diese Bewertungen sind eigentlich keine Likert- Skala . Sie sind nur ordinale Bewertungen. Nachdem Sie das gesagt haben, ist Ihr Standpunkt im Wesentlichen richtig. Ich denke jedoch oft, dass zu viel von diesem Thema gemacht wird. Eine Sache zu beachten ist , dass es in der Regel versteht sich, dass der Mittelwert einer Anzahl von Ordnungs Elemente können etwa Intervall, und somit , wenn es viele Bewertungen der Mittelwert wird eine vernünftige Darstellung. Ich fand diese Antwort von @JeromyAnglim ausgezeichnet (wirklich, die Frage und alle dazugehörigen Antworten sind lesenswert). Eine theoretischere Behandlung finden Sie hier. Aus einem anderen Grund mag ich Amazon, aber ich sehe keinen Grund, statistische Raffinesse von ihnen zu erwarten, insbesondere in Bezug auf die grundlegende Gestaltung der Website - der Punkt ist die Benutzerfreundlichkeit durch die Verbraucher, nicht um Professoren zu beeindrucken.
quelle
Jeder hat eine gute Meinung dazu. Ich glaube nicht, dass ich noch viel mehr hinzufügen kann. Ich werde dies jedoch posten :
quelle
Nach meiner Erfahrung korreliert der Mittelwert der Ratingskala-Daten häufig am besten mit der Ebene der realen Metriken, die wir mit der Ratingskala zu verknüpfen versuchen. Wir haben viele lineare Beziehungen gefunden, und der Durchschnitt ist daher eine der besseren Möglichkeiten, die Daten zusammenzufassen. Wie Jeromy betonte, werden die meisten Methoden zur Analyse der zentralen Tendenz einer Ratingskala jedoch die meiste Zeit zu ähnlichen Ergebnissen führen (Rangfolgen usw.).
Ich vermute auch, dass Amazon nicht alles ist, was mit der wissenschaftlichen Gültigkeit auf die eine oder andere Weise zu tun hat. Letztendlich ist es das Ziel von Amazon, die Menschen dazu zu bringen, mehr auf Amazon.com einzukaufen, und die Art und Weise, wie Bewertungen dazu beitragen, wird wahrscheinlich nicht von der verwendeten Ein-Zahlen-Zusammenfassung abhängen. Gute Produkte werden belohnt, wirklich schlechte Produkte bestraft und nervöse Käufer haben die Möglichkeit, Vor- und Nachteile genauer zu prüfen.
quelle
Die Bewertungen von Amazon sind irreführend, da Unternehmen das System spielen. Wenn Kunden im Gegenzug für 5-Sterne-Bewertungen Rabatte und Gratiswaren angeboten werden, ist die "Statistik" darüber, was die Bewertungszahl ist oder bedeutet, umstritten.
quelle
Sie machen einen guten Punkt. Der Mittelwert der Ordnungszahlen ist etwas irreführend. Jede Zusammenfassung mehrerer Rankings würde unter der Tatsache leiden, dass meine subjektive 3 tatsächlich Ihrer 4 entspricht. Die Kombination verschiedener Einzelbewertungen ist also wahrscheinlich das größte Problem. Das Interpretieren des Durchschnitts von 3 und 4 als 3,5 ist bei weitem nicht so ungeheuerlich.
quelle