Nehmen Sie den Fall von Buchbewertungen auf einer Website. Buch A wird von 10.000 Personen mit einer durchschnittlichen Bewertung von 4,25 und der Varianz bewertet . In ähnlicher Weise wird Buch B von 100 Personen bewertet und hat eine Bewertung von 4,5 mit σ = 0,25 .
Aufgrund des großen Stichprobenumfangs von Buch A hat sich der Mittelwert auf 4,25 stabilisiert. Für 100 Personen kann es sein, dass die durchschnittliche Bewertung auf 4 oder 4,25 sinkt, wenn mehr Personen Buch B lesen.
- Wie ist der Mittelwertvergleich aus verschiedenen Stichproben zu interpretieren und was sind die besten Schlussfolgerungen, die man ziehen kann / sollte?
Zum Beispiel - können wir wirklich sagen, dass Buch B besser ist als Buch A.
t-test
mean
sample-size
PhD
quelle
quelle
Antworten:
Um meinen Standpunkt zur Leistung zu verdeutlichen, ist hier eine sehr einfache Simulation, die für R geschrieben wurde:
Ich denke analog dazu. Wenn Sie die Fläche eines Rechtecks kennen möchten und der Umfang festgelegt ist, wird die Fläche maximiert, wenn Länge und Breite gleich sind (dh wenn das Rechteck ein Quadrat ist ). Andererseits schrumpft der Bereich, wenn Länge und Breite auseinander gehen (wenn das Rechteck länglich wird).
quelle
set.seed()
Funktion stellt sicher, dass Sie die gleiche Ausgabe erhalten. Lassen Sie mich wissen, ob es immer noch zu schwierig ist, zu folgen.Zusätzlich zu der Antwort von @gung, die Sie auf den t-Test verweist, scheint es, dass Sie an Bayes'schen Bewertungssystemen interessiert sind (z. B. hier ist eine Diskussion ). Websites können solche Systeme verwenden, um Ordnungselemente zu ordnen, die sich in der Anzahl der erhaltenen Stimmen unterscheiden. Im Wesentlichen funktionieren solche Systeme, indem sie eine Bewertung zuweisen, die sich aus der mittleren Bewertung aller Elemente plus dem Mittelwert der Stichprobe von Bewertungen für das spezifische Objekt zusammensetzt. Wenn die Anzahl der Bewertungen zunimmt, nimmt das dem Mittelwert für das Objekt zugewiesene Gewicht und das dem Mittelwert für alle Artikel zugewiesene Gewicht ab. Vielleicht schauen Sie sich Bayesian Durchschnittswerte .
Natürlich können die Dinge viel komplexer werden, wenn Sie sich mit einer Vielzahl von Themen befassen, z. B. Abstimmungsbetrug, Änderungen im Laufe der Zeit usw.
quelle