Warum überzeugen 600 von 1000 mehr als 6 von 10?

41

Sehen Sie sich diesen Auszug aus "The Study Skills Handbook", Palgrave, 2012, von Stella Cottrell, Seite 155 an:

Prozentsätze Beachten Sie, wenn Prozentsätze angegeben werden.
Angenommen, stattdessen lautet die obige Aussage:

60% der Menschen bevorzugten Orangen; 40% gaben an, Äpfel zu bevorzugen.

Das sieht überzeugend aus: Es werden numerische Größen angegeben. Aber ist der Unterschied zwischen 60% und 40% signifikant ? Hier müssten wir wissen, wie viele Leute gefragt wurden. Wenn 1000 Personen befragt würden, von denen 600 Orangen bevorzugen, wäre die Zahl überzeugend. Wenn jedoch nur 10 Personen befragt wurden, bedeutet 60%, dass 6 Personen Orangen bevorzugen. "60%" klingt überzeugend, "6 von 10" nicht. Als kritischer Leser müssen Sie nach Prozentsätzen Ausschau halten, mit denen unzureichende Daten beeindruckend aussehen.

Wie heißt dieses Merkmal in der Statistik? Ich würde gerne mehr darüber lesen.

statistical-significance sample-size percentage Juya
quelle

38

Stichprobengröße zählt

Aksakal

36

Ich wähle zufällig zwei Personen aus, die beide männlich sind, und komme daher zu dem Schluss, dass 100% der Amerikaner männlich sind. Überzeugend?

Casey

2

Es ist das Prinzip "Äpfel nicht mit Orangen vergleichen"

Wolfies

2

Um sich dieser Frage aus einem anderen Blickwinkel zu nähern, können Sie die Literatur zum Framing-Effekt durchsuchen. Es ist jedoch ein Beispiel für kognitive Voreingenommenheit und ein psychologisches Thema, nicht statistisch.

Larx

2

Sie können sich einen Unterschied von 1 vorstellen, wie stark sich dies auf die geschätzte Menge auswirkt. 7/10 ist viel weiter relativ von 6/10 als 601/1000 von 600/1000.

Kathreadler

54

Ich möchte ein weiteres intuitives Beispiel auflisten.

Angenommen, ich sage Ihnen, ich kann das Ergebnis eines Münzwurfs vorhersagen. Sie glauben nicht und wollen meine Fähigkeiten testen.

Sie haben 5 Mal getestet, und ich habe alle richtig verstanden. Glaubst du, ich habe die besondere Fähigkeit? Vielleicht nicht. Weil ich sie alle zufällig richtig machen kann. (Angenommen, die Münze ist eine faire Münze und jedes Experiment ist unabhängig. Dann kann ich mit ohne Supermacht alle Rechte . Einen Witz dazu finden Sie unter Shufflepants ' Link .) $0.5^5\approx0.03$

Wenn Sie mich jedoch häufig getestet haben, ist es sehr unwahrscheinlich, dass ich es durch Zufall bekomme. Wenn Sie beispielsweise mal getestet haben, ist die Wahrscheinlichkeit, dass ich sie alle richtig einsetze, . $100$ $0.5^{100}\approx 0$

Das statistische Konzept wird von Wikipeida als statistische Kraft bezeichnet

Die Potenz eines binären Hypothesentests ist die Wahrscheinlichkeit, dass der Test die Nullhypothese (H0) korrekt ablehnt, wenn die alternative Hypothese (H1) wahr ist.

Zurück zum Super Power On Coin Flip Beispiel, im Wesentlichen möchten Sie einen Hypothesentest durchführen.

Nullhypothese (H0): Ich habe nicht die Supermacht
Alternative Hypothese (H1): Ich habe die Supermacht

Wie Sie im numerischen Beispiel sehen können (testen Sie mich 5-mal und testen Sie mich 100-mal), wurde die statistische Aussagekraft von der Stichprobengröße beeinflusst.

Mehr zu lesen hier . (Technischer und basierend auf T-Test).

Ein interaktives Tool zum Verstehen der statistischen Leistung finden Sie hier . Beachten Sie, dass sich die statistische Leistung mit der Stichprobengröße ändert!

Haitao Du
quelle

24

Obligatorische XKCD

Shufflepants

5

Dies beantwortet die Frage nicht wirklich. Die Frage besteht aus zwei Teilen: "Warum ist [es] überzeugender ..." und "Wie heißt dieses Merkmal in der Statistik?" Sie haben ein Beispiel bereitgestellt, das den Leser fragt, ob er vom Beispiel überzeugter ist, aber Sie haben das Phänomen nicht erklärt und auch nicht versucht, herauszufinden, warum es überzeugender ist (verlassen Sie sich einfach auf die intuitive Argumentation des Lesers in einem einzelnen Beispiel). Darüber hinaus haben Sie die zweite Frage nicht angesprochen: Wenn Sie der Meinung sind, dass dieses Phänomen keinen Namen hat, geben Sie dies ausdrücklich an.

Makyen

1

@Mayken Das ist einfach eine versuchte Antwort. Es ist nicht die beste Antwort und keine vollständige Antwort, aber partielle oder gesellschaftliche Antworten sind kein Grund zu der Behauptung, dass es überhaupt keine Antwort ist. Fragen sollten eine Frage stellen, und wenn sie eine Reihe von Fragen stellen, ist es meines Erachtens völlig vernünftig (wenn auch nicht ideal), nur einige von ihnen anzusprechen. Wenn Sie der Meinung sind, dass es eine schlechte Antwort ist, können Sie die Probleme, die Sie als Probleme ansehen, auf jeden Fall angehen. [Ich glaube auch nicht, dass ich die zweite Frage beantwortet habe; Ich habe nur den Effekt besprochen; nicht jedes Phänomen wird einen expliziten Namen haben]

Glen_b

1

Ich kann nicht anders, als das Gefühl zu haben, dass 100% ein Sonderfall ist und diese Antwort meine Vorstellung, dass 600/1000 überzeugender ist als 6/10, nicht wirklich bestätigt. Auch wenn wir es nicht als Sonderfall betrachten, ist dies im Wesentlichen nur eine Wiederholung des Problems mit einem anderen Prozentsatz.

NotThatGuy

2

@Juya ist ein webbasiertes Tool, das von jemandem erstellt wurde. Sie können es hier

Haitao Du

29

Denken Sie in Proportionen darüber nach. Nehmen wir an, dass das Bevorzugen einer Orange ein Erfolg ist, während das Bevorzugen eines Apfels ein Misserfolg ist. Ihre mittlere Erfolgsrate ist also Erfolge $\mu = \frac{\text{# of sucesses}}{n}$

Der Standardfehler dieser Größe wird auf geschätzt $\sqrt{\frac{\mu(1-\mu)}{n}}$ $\approx .155$ $\approx .0155$

Ryan Honea
quelle

17

Dieses Konzept ist eine Konsequenz des Gesetzes der großen Zahlen . Aus Wikipedia ,

Nach dem Gesetz sollte der Durchschnitt der Ergebnisse einer großen Anzahl von Versuchen nahe am erwarteten Wert liegen und wird sich mit zunehmender Anzahl von Versuchen tendenziell annähern.

Die Ergebnisse einer kleinen Stichprobe können vom erwarteten Wert weiter entfernt sein als die Ergebnisse einer größeren Stichprobe. Und so sollte man, wie in der Frage ausgeführt, vorsichtig mit Ergebnissen umgehen, die aus kleinen Stichproben berechnet wurden. Die Idee wird auch in diesem youTube-Video ziemlich gut erklärt .

Evan Phibbs
quelle

5

Es gibt mehrere bekannte Theoreme, die in der Statistik als "Gesetze großer Zahlen" bezeichnet werden, aber keine von ihnen gibt Aussagen ab, die der in Frage kommenden entsprechen. Wie stellen Sie dann die Verbindung her?

Whuber

3

Aus wikipedia de.wikipedia.org/wiki/Law_of_large_numbers : "Laut Gesetz sollte der Durchschnitt der Ergebnisse einer großen Anzahl von Versuchen nahe am erwarteten Wert liegen und wird sich mit zunehmender Anzahl von Versuchen tendenziell annähern." . Die Ergebnisse einer kleinen Stichprobe können vom erwarteten Wert weiter entfernt sein als die Ergebnisse einer größeren Stichprobe. Und so sollte man, wie in der Frage ausgeführt, vorsichtig mit Ergebnissen sein, die aus kleinen Stichproben berechnet wurden.

Evan Phibbs

6

Das ist eine gute Erklärung, danke. Obwohl Sie richtig schreiben, dass man vorsichtig sein sollte, wie viele "große Anzahl von Prozessen" erforderlich sind, damit das Gesetz vertrauenswürdig ist, ist die Anwendung intuitiv solide. Ich möchte vorschlagen, dass Ihre Erklärung zu Ihrer Antwort gehört, wo sie allgemeiner gelesen und geschätzt wird, anstatt in einem Kommentar begraben zu werden. Nur-Link-Antworten (wie dein Link zu Youtube) ohne Erklärung halten hier nicht an.

whuber

6

Wir sind in der Lage, eine Populationsmenge durch eine Stichprobenmenge abzuschätzen. In diesem Fall verwenden wir Stichprobenanteile, um die Bevölkerungsanteile zu schätzen, aber das Prinzip ist wesentlich allgemeiner.

$1$ $0$ $1$ $0$ $1$

Wenn wir immer größere Stichproben nehmen (unter Verwendung von Zufallsstichproben), tendieren die Stichprobenmittel zur Konvergenz mit dem Populationsmittelwert. (Dies ist das Gesetz der großen Zahlen.)

Wir möchten jedoch wirklich eine Vorstellung davon haben, wie weit wir entfernt sein könnten (z. B. durch die Breite eines Konfidenzintervalls für den Anteil oder durch die Fehlergrenze, die normalerweise die Hälfte einer solchen Breite beträgt). .

$\frac{_1}{^{20}}$

$\frac{_1}{^\sqrt{n}}$

Infolgedessen sind wir zuversichtlicher in Bezug auf die Genauigkeit unserer Schätzung, wenn die Stichprobe groß ist - wenn wir unser Experiment erneut wiederholen, würden andere derartige Mittel dem aktuellen nahe kommen -, und sie gruppieren sich immer enger Da unsere Schätzung (in diesem Fall) unbefangen ist, gruppieren sie sich um die Werte, die wir schätzen möchten. Ein einzelner Stichprobenmittelwert wird immer aussagekräftiger, wo sich der Mittelwert der Grundgesamtheit befinden könnte.

Glen_b
quelle

4

Eine Faustregel für das "Zählen" von Statistiken, wie das Zählen der Anzahl von Personen, die Orangen mögen, oder das Zählen der Anzahl von "Klicks" in einem Geigerzähler aufgrund des radioaktiven Zerfalls, lautet, dass die Fehlerquote für die Zählung ungefähr das Quadrat ist -Stamm des erwarteten Zählwerts. Es sind Zählstatistiken bekannt, die Poisson-Statistiken sind.

Die Quadratwurzel von 6 ist 2,4-ish, die Fehlertoleranz beträgt also etwa 40% (2,4 / 6). Die Quadratwurzel von 600 ist 24-ish, die Fehlerquote beträgt also ungefähr 4% (24/600). Aus diesem Grund ist das Zählen von 600 wichtiger als das Zählen von 6. Der relative Fehler beträgt ein Zehntel.

Ich bin ein wenig nachlässig in Bezug auf die Definition der Fehlergrenze. Es ist wirklich der 1-Sigma-Wert und kein harter Grenzwert, aber es ist der Bereich, in dem Sie erwarten, dass die meisten (68%) der Messungen liegen. Wenn Sie also 6 Orangenfresser erwarten, erwarten Sie eine Reihe von Umfragen, die Ihnen hauptsächlich Zahlen im Bereich von 4 bis 8 liefern, wie 6,6,5,6,7,2,4,6,3,5,6. 6,7,6,10,8,6,5,6,6,9,3,7,8.

Mark Lakata
quelle

3

Ich habe nicht den Namen, den Sie suchen, aber das Problem ist nicht statistisch. Die Art und Weise, wie Menschen Zahlen in unserem Gehirn verarbeiten, gibt größeren Zahlen mehr Gewicht (Autorität) als kleineren Zahlen, da die Größe (physische Größe) visuell genauso wichtig ist wie der repräsentative Wert. Somit erscheint 600/1000 glaubwürdiger als 6/10. Aus diesem Grund bevorzugen Käufer 10% Rabatt! für Werte unter 100 und "Sparen Sie $ 10!" für Werte über 100 (als "100er-Regel" bezeichnet). Es geht darum, wie unser Gehirn auf Wahrnehmung reagiert.

Ein erstaunlicher Blick auf diese und ähnliche Phänomene wird von Nick Kolenda in seiner Online-Abhandlung " Ein enormer Leitfaden zur Preispsychologie " behandelt.

JBH
quelle

2

Auch wenn andere Antworten nicht falsch sind, sehe ich, dass sie den zitierten Text so wie er ist nicht richtig ansprechen. Der Text befasst sich mit der Auswirkung der Darstellung der Zahlen und der wahrgenommenen Genauigkeit, nicht wenn die Zahlen tatsächlich genauer sind. Das heißt, dass Sie eine Person erkennen lassen können, dass Ihre Informationen wichtiger sind, indem Sie 600 von 1000 oder 60% sagen, oder dass Sie bewirken können, dass 6 von 10 als weniger wichtig erscheinen, auch wenn jedes dieselbe Bedeutung hat, indem Sie eine kleinere Stichprobe implizieren Größe, ohne dass dies tatsächlich angegeben oder sogar möglicherweise wahr ist.

DLB

1

Dieses Beispiel scheint meiner Meinung nach grundlegend fehlerhaft zu sein. Zum Beispiel erhält ein Einkauf von 100 einen Rabatt von 10% für insgesamt 90, während ein Einkauf von 100,01 einen Rabatt von 25% für insgesamt 75,01 erhält, was zu einem völlig anderen Preis führt. In der Tat gibt es einen Unterschied in den Werten, bis Sie auf 250,05 (oder 250,10, je nach Abrundung oder Kürzung) kommen. Bei der Frage geht es um Stichprobengröße und Standardfehler, während es sich bei Ihrem Beispiel aufgrund unserer Wahrnehmung eher um einen tatsächlichen Unterschied handelt.

Joe W

@Joe W, ich kann zwar nicht mit den Einzelheiten der "100er-Regel" sprechen (kein Psychologe), meine Antwort lautet jedoch, dass Psychologen festgestellt haben, dass Menschen einer größeren Zahl vertrauen, nicht wegen der größeren Stichprobengröße, die es darstellt, aber aufgrund der Wahrnehmung der größeren Bedeutung, die einer größeren Zahl beigemessen wird. Als Ingenieur wäre es mir lieber, wenn es nicht so wäre - aber so arbeitet der menschliche Geist. Wenn Sie dies in Frage stellen möchten, empfehle ich, die zugrunde liegenden Details der Präsentation von Herrn Kolenda zu lesen.

JBH

Sie vermissen meinen Standpunkt, es gibt einen größeren Unterschied bei den 10% zu 100 und 25, es ist nicht nur eine Frage der Wahrnehmung. Die einfache Tatsache ist, wenn Sie beide Werte auf 100 gesetzt haben, gibt es einen Unterschied von 15%. Dieser Wert ist viel einfacher zu messen als der Standardfehler, wenn Sie zwei verschiedene Stichproben, eine von 10 und eine von 1000, sprechen.

Joe W

Ich habe meine Frage so geändert, dass 10% und 10 $ verwendet werden, um Ihnen zu helfen. Der Punkt der "100er-Regel" ist, dass die Menschen größere Zahlen als relevanter und den Geldwert als wichtiger als ein bloßer Prozentsatz wahrnehmen. Es ist ein Thema, das für die Zwecke des OP etwas außerhalb des Diskussionsbereichs liegt.

JBH

3

Während die tatsächliche Fehlerquote wichtig ist, liegt der Grund dafür, dass sie überzeugender klingt , in einer heuristischeren Erfahrung (Faustregel) mit Menschen. Die tatsächliche Fehlerquote bestätigt, dass diese Heuristik sinnvoll ist.

Wenn die Stichprobe 6 für und 4 gegen ist, kann dies 50/50 sein, wenn eine einzelne Person ihre Stimme ändert oder eine einzelne Person irrtümlich erfasst wurde. Es gibt nur noch zwei Personen auf der 6 Seite. Jeder kennt zwei Flocken, jeder weiß, dass die Probe geerntet werden könnte: Sie haben nur Kellnerinnen und sonst niemanden gefragt. Oder Sie haben nur 10 Hochschulprofessoren in den Hallen einer Universität befragt. Oder Sie haben 10 wohlhabende Leute außerhalb der Saks Fifth Avenue gefragt.

Sogar die mathematische Fehlerquote setzt echte Zufälligkeit voraus und berücksichtigt keine Auswahlverzerrung oder Selbstauswahlverzerrung oder irgendetwas anderes, was die Leute intuitiv verstehen können.

Im Gegensatz dazu hat das Ergebnis von 600 vs. 400 mehr Menschen auf der einen Seite als auf der anderen, und 100 Menschen müssten ihre Meinung ändern. Es ist sehr schwierig (aber nicht unmöglich), diese Zahlen durch einen Unfall zu ermitteln, bei dem Sie Umfragen durchgeführt haben, wie Sie die Leute dazu gebracht haben, sich zu einigen, wie Einzelpersonen die Frage verstanden oder interpretiert haben usw.

Es ist überzeugender, nicht weil es sich um einen mathematischen Beweis handelt, sondern weil wir aus Erfahrung wissen, dass Massen von 1000 Menschen sehr viel wahrscheinlicher in ihren Meinungen (zu irgendetwas) verschieden sind als eine Gruppe von 10 Personen (es sei denn, Sie haben dies heimlich getan) Ihre Wahl bei einem Parteitag oder einer KKK-Kundgebung oder etwas anderes, das wahrscheinlich eine einseitige Menge anzieht).

Die Mathematik quantifiziert nur genau das, was wir bereits durch Intuition wissen; dass es einfacher ist, zufällig auf ein oder zwei von 10 Streustimmen zu stoßen, als auf 100 oder 200 von 1000 Streustimmen.

Amadeus-Reinstate-Monica
quelle

3

Was nicht erwähnt wurde, ist die Betrachtung des Problems aus bayesianischer Sicht.

$p$ $p$

p \sim B e t a (α, β) n_{o} | p \sim B i n (n, p) .

$p \sim \mathrm{Beta}(\alpha, \beta)\\ n_o|p \sim \mathrm{Bin}(n,p).$

$\beta=\alpha$ $\beta=\alpha=1$ $p$ $\mathrm{U}(0,1)$

$n$ $n_o$ $n_a=n-n_o$

$p$

p | n_{o}, n_{a} \sim B e t a (n_{o} + 1, n_{a} + 1) .

$p|n_o,n_a \sim \mathrm{Beta}(n_o+1, n_a+1).$

$p$ $n_o/(n_o+n_a)$ $n$

$n_o=6$ $n_a=4$

$n_o=600$ $n_a=400$

$p=0.4$ $p=0.8$

Bitte beachten Sie, dass diese Darstellungen , obwohl sie denen von david25272 ähneln, etwas ganz anderes darstellen .

$p$ $n_o$

$n_o$ $p$

Luca Citi
quelle

2

Die kurze Antwort:

Im Grunde ist es mehr davon zu überzeugen , weil 600 von 1000 als sechs von 10 zu haben, bei gleichen Einstellungen ist es weit eher für 6 von 10 durch Zufall auftreten.

Nehmen wir an, dass der Anteil, der Orangen und Äpfel bevorzugt, tatsächlich gleich ist (also jeweils 50%). Nennen Sie dies eine Nullhypothese. Bei diesen gleichen Wahrscheinlichkeiten ist die Wahrscheinlichkeit der beiden Ergebnisse:

Bei einer Stichprobe von 10 Personen besteht eine 38% ige Chance, zufällig eine Stichprobe von 6 oder mehr Personen zu erhalten, die Orangen bevorzugen (was nicht allzu unwahrscheinlich ist).
Bei einer Stichprobe von 1000 Personen besteht eine geringere Wahrscheinlichkeit als eine Milliarde, dass 600 oder mehr von 1000 Personen Orangen bevorzugen.

(Der Einfachheit halber gehe ich von einer unendlichen Population aus, aus der eine unbegrenzte Anzahl von Proben gezogen werden kann.)

Eine einfache Herleitung

Eine Möglichkeit, dieses Ergebnis abzuleiten, besteht darin, einfach die möglichen Kombinationsmöglichkeiten der Personen in unseren Stichproben aufzulisten:

Für zehn Personen ist es einfach:

Ziehen Sie Stichproben von 10 Personen nach dem Zufallsprinzip aus einer unendlichen Anzahl von Personen mit den gleichen Vorlieben für Äpfel oder Orangen in Betracht. Bei gleichen Vorlieben ist es einfach, alle möglichen Kombinationen von 10 Personen aufzulisten:

Hier ist die vollständige Liste.

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r ist die Anzahl der Ergebnisse (Personen, die Orangen bevorzugen), C ist die Anzahl der möglichen Arten, wie viele Personen Orangen bevorzugen, und p ist die resultierende diskrete Wahrscheinlichkeit dafür, dass viele Personen in unserer Stichprobe Orangen bevorzugen.

(p ist nur C geteilt durch die Gesamtzahl der Kombinationen. Beachten Sie, dass es insgesamt 1024 Möglichkeiten gibt, diese beiden Präferenzen anzuordnen (dh 2 hoch 10).

Zum Beispiel gibt es nur einen Weg (eine Probe) für 10 Personen (r = 10), um Orangen zu bevorzugen. Gleiches gilt für alle Menschen, die Äpfel bevorzugen (r = 0).
Es gibt 10 verschiedene Kombinationen, von denen neun Orangen bevorzugen. (Eine andere Person bevorzugt Äpfel in jeder Probe).
Es gibt 45 Proben (Kombinationen), bei denen 2 Personen Äpfel usw. bevorzugen.

(Im Allgemeinen geht es um n Cr- Kombinationen von Ergebnissen r aus einer Stichprobe von n Personen. Es gibt Online-Taschenrechner, mit denen Sie diese Zahlen überprüfen können.)

Diese Liste ermöglicht es uns, die obigen Wahrscheinlichkeiten mit nur einer Division anzugeben. Es besteht eine 21% ige Chance, dass 6 Personen in die Stichprobe aufgenommen werden, die Orangen bevorzugen (210 von 1024 der Kombinationen). Die Wahrscheinlichkeit, sechs oder mehr Personen in unsere Stichprobe aufzunehmen, beträgt 38% (die Summe aller Stichproben mit sechs oder mehr Personen oder 386 von 1024 Kombinationen).

Grafisch sehen die Wahrscheinlichkeiten so aus:

Bei größeren Zahlen nimmt die Anzahl der möglichen Kombinationen schnell zu.

Für eine Stichprobe von nur 20 Personen gibt es 1.048.576 mögliche Stichproben, alle mit gleicher Wahrscheinlichkeit. (Hinweis: Ich habe nur jede zweite Kombination unten gezeigt).

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

Es gibt immer noch nur eine Probe, bei der alle 20 Menschen Orangen bevorzugen. Kombinationen mit gemischten Ergebnissen sind sehr viel wahrscheinlicher, da die Personen in den Stichproben auf viel mehr Arten kombiniert werden können.

Verzerrte Stichproben sind viel unwahrscheinlicher, nur weil weniger Personenkombinationen zu diesen Stichproben führen können:

Mit nur 20 Personen in jeder Stichprobe sinkt die kumulative Wahrscheinlichkeit, dass 60% oder mehr (12 oder mehr) Personen in unserer Stichprobe Orangen bevorzugen, auf nur 25%.

Es ist zu sehen, dass die Wahrscheinlichkeitsverteilung dünner und größer wird:

Mit 1000 Leuten sind die Zahlen riesig

Wir können die obigen Beispiele auf größere Stichproben ausweiten (aber die Zahlen wachsen zu schnell, als dass es möglich wäre, alle Kombinationen aufzulisten), stattdessen habe ich die Wahrscheinlichkeiten in R berechnet:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

Die kumulative Wahrscheinlichkeit, dass 600 oder mehr von 1000 Menschen Orangen bevorzugen, liegt bei nur 1,364232e-10.

Die Wahrscheinlichkeitsverteilung ist jetzt viel konzentrierter um das Zentrum:

[ Binomialprobengröße 1000 [3]

(Um beispielsweise die Wahrscheinlichkeit zu berechnen, dass genau 600 von 1000 Personen Orangen in R bevorzugen dbinom(600, 1000, prob=0.5), entspricht dies 4,633908e-11, und die Wahrscheinlichkeit von 600 oder mehr Personen 1-pbinom(599, 1000, prob=0.5)entspricht 1,364232e-10 (weniger als 1 in einer Milliarde).

david25272
quelle

1

Dies liegt daran, dass eine höhere Zahl eine größere Genauigkeit gewährleistet. Zum Beispiel, wenn Sie 1000 zufällige Personen von irgendwo auf dem Planeten aufnehmen würden und 599 von ihnen männlich gegen 10 zufällige Personen mit 6 männlich sind, wäre der erstere genauer. Wenn Sie eine Bevölkerung von 7 Milliarden Menschen annehmen und die Anzahl der Männer berechnen, erhalten Sie eine genauere Zahl, die offensichtlich überzeugender ist als bei nur 1000 Menschen.

Zee
quelle

Warum überzeugen 600 von 1000 mehr als 6 von 10?

Antworten:

Die kurze Antwort:

Eine einfache Herleitung