Evan Millers " Wie man nicht nach Durchschnittsbewertung sortiert " schlägt vor, die Untergrenze eines Konfidenzintervalls zu verwenden, um eine vernünftige Gesamtpunktzahl für bewertete Artikel zu erhalten. Es funktioniert jedoch mit einem Bernoulli-Modell: Bewertungen sind entweder Daumen hoch oder Daumen runter.
Was ist ein angemessenes Konfidenzintervall für ein Bewertungsmodell, das eine diskrete Punktzahl von bis Sternen zuweist , vorausgesetzt, die Anzahl der Bewertungen für einen Artikel ist möglicherweise gering?k
Ich denke, ich kann sehen, wie man das Zentrum der Wilson- und Agresti-Coull-Intervalle so anpasst
Dabei ist entweder oder (wahrscheinlich besser) die durchschnittliche Bewertung aller Elemente. Ich bin mir jedoch nicht sicher, wie ich die Breite des Intervalls anpassen soll. Meine (überarbeitete) beste Vermutung wäre
mit , aber ich kann es nicht rechtfertigen, wenn ich es als Analogie zu Agresti-Coull von Hand winke
Gibt es Standard-Konfidenzintervalle, die gelten? (Bitte beachten Sie, dass ich keine Zeitschriften abonniert habe und keinen einfachen Zugang zu einer Universitätsbibliothek habe. Geben Sie auf jeden Fall die richtigen Referenzen an, aber ergänzen Sie diese mit dem tatsächlichen Ergebnis!)
quelle
Antworten:
Wie Karl Broman in seiner Antwort sagte, wäre ein Bayes-Ansatz wahrscheinlich viel besser als die Verwendung von Konfidenzintervallen.
Das Problem mit den Konfidenzintervallen
Warum funktioniert die Verwendung von Konfidenzintervallen möglicherweise nicht gut? Ein Grund dafür ist, dass Ihr Konfidenzintervall sehr breit ist, wenn Sie nicht viele Bewertungen für einen Artikel haben, sodass die Untergrenze des Konfidenzintervalls klein ist. So landen Artikel ohne viele Bewertungen am Ende Ihrer Liste.
Intuitiv möchten Sie jedoch wahrscheinlich, dass sich Artikel ohne viele Bewertungen in der Nähe des durchschnittlichen Artikels befinden. Sie möchten also Ihre geschätzte Bewertung des Artikels in Richtung der mittleren Bewertung über alle Artikel bewegen (dh Sie möchten Ihre geschätzte Bewertung auf einen früheren Wert verschieben ). . Genau das leistet ein Bayes'scher Ansatz.
Bayesianischer Ansatz I: Normalverteilung über Ratings
Eine Möglichkeit, die geschätzte Bewertung auf eine Prioritätsstufe zu verschieben, besteht, wie in Karls Antwort, darin, eine Schätzung der Form :w ≤ R + ( 1 - w ) ≤ C
Diese Schätzung kann in der Tat als hintere Schätzung der mittleren Bewertung des Artikels nach Bayes interpretiert werden, wenn die einzelnen Bewertungen aus einer Normalverteilung stammen , die um diesen Mittelwert zentriert ist.
Unter der Annahme, dass Ratings von einer Normalverteilung stammen, gibt es jedoch zwei Probleme:
Bayesianischer Ansatz II: Multinomiale Verteilung über Ratings
Anstatt eine Normalverteilung für Ratings anzunehmen, nehmen wir eine multinomiale Verteilung an. Das heißt, bei einem bestimmten Gegenstand gibt es eine Wahrscheinlichkeit dass ein zufälliger Benutzer ihm 1 Stern gibt, eine Wahrscheinlichkeit dass ein zufälliger Benutzer ihm 2 Sterne gibt, und so weiter.p 2p1 p2
Natürlich haben wir keine Ahnung, wie hoch diese Wahrscheinlichkeiten sind. Da wir immer mehr Bewertungen für diesen Artikel erhalten, können wir davon ausgehen, dass in der Nähe von , wobei die Anzahl der Benutzer ist, die ihm 1 Stern gegeben haben, und die Gesamtzahl der Benutzer ist, die bewertet haben das Einzelteil, aber wenn wir zuerst anfangen, haben wir nichts. Daher setzen wir diesen Wahrscheinlichkeiten ein Dirichlet vor .n 1p1 n1n n1 n D i r ( α1, … , Αk)
Was hat dieses Dirichlet vor? Wir können uns jeden Parameter als "virtuelle Zählung" der , mit der eine virtuelle Person den Gegenstand mit Sternen bewertet hat. Wenn beispielsweise , und alle anderen gleich 0 sind, können wir uns dies so vorstellen, dass zwei virtuelle Personen den Gegenstand 1 Stern und eine virtuelle Person den Gegenstand 2 gegeben haben Sterne. Bevor wir also überhaupt tatsächliche Benutzer erhalten, können wir diese virtuelle Verteilung verwenden, um eine Schätzung der Bewertung des Elements bereitzustellen.αich ich α1= 2 α2= 1 αich
[Eine Möglichkeit, die Parameter , besteht darin, gleich dem Gesamtanteil der Stimmen von Sternen zu setzen. (Beachten Sie, dass die Parameter nicht unbedingt ganze Zahlen sind.)]αich αich ich αich
Sobald die tatsächlichen Bewertungen eingegangen sind, addieren Sie einfach ihre Anzahl zu der virtuellen Anzahl Ihres Dirichlet-Vorgängers. Wenn Sie die Bewertung Ihres Artikels schätzen möchten, geben Sie einfach den Mittelwert über alle Bewertungen des Artikels an (sowohl die virtuellen Bewertungen als auch die tatsächlichen Bewertungen).
quelle
Diese Situation erfordert einen bayesianischen Ansatz. Es gibt einfache Ansätze für die Bayes'sche Rangfolge von Ratings hier (beachten Sie insbesondere die Kommentare, die interessant sind) und hier und dann einen weiteren Kommentar zu diesen hier . In einem der Kommentare im ersten dieser Links heißt es:
quelle