Vielen Dank im Voraus, dass Sie sich mit mir in Verbindung gesetzt haben. Ich bin kein Statistiker und weiß nicht, wie ich beschreiben soll, was ich mir vorstelle. Google hilft mir hier also nicht weiter ...
Ich füge ein Bewertungssystem in eine Webanwendung ein, an der ich arbeite. Jeder Benutzer kann jeden Artikel genau einmal bewerten.
Ich stellte mir eine Skala mit 4 Werten vor: "stark nicht mögen", "nicht mögen", "mögen" und "stark mögen", und ich hatte geplant, diese Werte von -5, -2, +2 bzw. +5 zuzuweisen .
Wenn nun jeder Artikel die gleiche Anzahl von Bewertungen haben würde, wäre ich mit diesem Bewertungssystem sehr zufrieden, da ich die beliebtesten und die am wenigsten beliebten Artikel klar unterscheide. Die Elemente haben jedoch nicht die gleiche Anzahl von Bewertungen, und die Unterschiede zwischen der Anzahl der Stimmen auf verschiedenen Fotos können sehr dramatisch sein.
In diesem Fall bedeutet der Vergleich der kumulativen Bewertungen für zwei Elemente, dass ein altes Element mit vielen mittelmäßigen Bewertungen eine viel höhere Bewertung aufweist als ein außergewöhnliches neues Element mit viel weniger Stimmen.
Das erste offensichtliche, was ich von uns dachte, ist ein Durchschnitt ... aber wenn ein Artikel nur eine Bewertung von "+5" hat, hat er einen besseren Durchschnitt als ein Artikel mit einer Bewertung von 99 "+5" und 1 "+2" Bewertung. Intuitiv ist dies keine genaue Darstellung der Beliebtheit eines Artikels.
Ich stelle mir vor, dass dieses Problem häufig auftritt, und ich brauche es nicht, um es mit weiteren Beispielen zu erläutern. Deshalb werde ich an dieser Stelle aufhören und bei Bedarf Kommentare ausarbeiten.
Meine Fragen sind:
- Wie heißt diese Art von Problem und gibt es einen Begriff für die Techniken, mit denen es gelöst wird? Ich würde das gerne wissen, damit ich es nachlesen kann.
- Wenn Sie Laien zu diesem Thema kennen, würde ich mich über einen Link sehr freuen.
- Schließlich würde ich mich über weitere Vorschläge zur effektiven Erfassung und Analyse dieser Art von Daten freuen.
Ich würde einen grafischen Ansatz verfolgen. Die x-Achse könnte eine durchschnittliche Bewertung sein und das y könnte eine Anzahl von Bewertungen sein. Ich habe dies mit Sportstatistiken gemacht, um den Beitrag junger Phänomene mit dem von Veteranenstars zu vergleichen. Je näher ein Punkt an der oberen rechten Ecke liegt, desto näher am Ideal. Natürlich wäre die Entscheidung für den "besten" Gegenstand immer noch eine subjektive Entscheidung, aber dies würde eine gewisse Struktur bieten.
Wenn Sie die durchschnittliche Bewertung gegen eine andere Variable zeichnen möchten, können Sie die Anzahl der Bewertungen als dritte Variable mithilfe der Blasengröße in einem Blasendiagramm festlegen, z. B. in XL oder SAS.
quelle