Ich habe eine Webseite erstellt, auf der die Ergebnisse der olympischen Live-Medaillen von Thompson Reuters und die weltweiten Bevölkerungszahlen der CIA abgerufen werden.
Die Ergebnisse sind für mich interessant - Ungarn hat einen zweistelligen Vorsprung bei Goldmedaillen gegenüber dem Rest der Welt. Auch die USA und China liegen in nahezu jeder Kategorie ganz unten.
Meine Frage ist - präsentiere ich die Daten auf faire Weise? Ich habe einfach die größte Bevölkerung genommen und dann einen Faktor für jedes Land basierend darauf erstellt. Die Spalten für die relative Medaillenzahl basieren auf diesem Faktor.
Welche Spalte (n) könnte ich hinzufügen? Welche anderen Faktoren könnte ich hinzufügen, um die fairste Sichtweise zu präsentieren? Die absolute Sicht ist einfach - Reuters macht das. Wie erstelle ich ein faires Bild?
quelle
Antworten:
Sie versuchen, eine Schätzung der Chance einer Person zu finden, eine Medaille zu gewinnen, da Sie wissen, dass die "Daten", die wir haben, nur die Anzahl nach Ländern sind. Es ist eine großartige Frage, eine faire Lösung, die dem Geist der Olympischen Spiele näher kommt.
Grundsätzlich ist dies ein statistisches Problem, das durch Ihre Methode als durchschnittliche Anzahl (Häufigkeit) von Medaillen (für jede Farbe) im Verhältnis zur Bevölkerung gut angenähert wird. Aber wie zuverlässig ist diese Methode? Dies kommt dem Problem der Schätzung der Zuverlässigkeit eines Binomialwurfs aus einer unterschiedlichen Anzahl von Würfen ziemlich nahe, bei dem beispielsweise die Qualität von Wiederverkäufern in Amazon anhand unterschiedlicher Rückmeldungszahlen verglichen werden kann (siehe diese ausführliche Erklärung ).
In diesem speziellen Fall reicht die Bevölkerungszahl immer aus, um die Beta-Verteilung mit einer Normalverteilung zu approximieren - so dass es durchaus möglich ist, die Signifikanz jeder Schätzung für jedes Land zu vergleichen.
quelle