Sehen Sie sich diesen Auszug aus "The Study Skills Handbook", Palgrave, 2012, von Stella Cottrell, Seite 155 an:
Prozentsätze Beachten Sie, wenn Prozentsätze angegeben werden.
Angenommen, stattdessen lautet die obige Aussage:60% der Menschen bevorzugten Orangen; 40% gaben an, Äpfel zu bevorzugen.
Das sieht überzeugend aus: Es werden numerische Größen angegeben. Aber ist der Unterschied zwischen 60% und 40% signifikant ? Hier müssten wir wissen, wie viele Leute gefragt wurden. Wenn 1000 Personen befragt würden, von denen 600 Orangen bevorzugen, wäre die Zahl überzeugend. Wenn jedoch nur 10 Personen befragt wurden, bedeutet 60%, dass 6 Personen Orangen bevorzugen. "60%" klingt überzeugend, "6 von 10" nicht. Als kritischer Leser müssen Sie nach Prozentsätzen Ausschau halten, mit denen unzureichende Daten beeindruckend aussehen.
Wie heißt dieses Merkmal in der Statistik? Ich würde gerne mehr darüber lesen.
Antworten:
Ich möchte ein weiteres intuitives Beispiel auflisten.
Angenommen, ich sage Ihnen, ich kann das Ergebnis eines Münzwurfs vorhersagen. Sie glauben nicht und wollen meine Fähigkeiten testen.
Sie haben 5 Mal getestet, und ich habe alle richtig verstanden. Glaubst du, ich habe die besondere Fähigkeit? Vielleicht nicht. Weil ich sie alle zufällig richtig machen kann. (Angenommen, die Münze ist eine faire Münze und jedes Experiment ist unabhängig. Dann kann ich mit ohne Supermacht alle Rechte . Einen Witz dazu finden Sie unter Shufflepants ' Link .)0,55≤ 0,03
Wenn Sie mich jedoch häufig getestet haben, ist es sehr unwahrscheinlich, dass ich es durch Zufall bekomme. Wenn Sie beispielsweise mal getestet haben, ist die Wahrscheinlichkeit, dass ich sie alle richtig einsetze, .0,5 100 ≤ 0100 0.5100≈0
Das statistische Konzept wird von Wikipeida als statistische Kraft bezeichnet
Zurück zum Super Power On Coin Flip Beispiel, im Wesentlichen möchten Sie einen Hypothesentest durchführen.
Wie Sie im numerischen Beispiel sehen können (testen Sie mich 5-mal und testen Sie mich 100-mal), wurde die statistische Aussagekraft von der Stichprobengröße beeinflusst.
Mehr zu lesen hier . (Technischer und basierend auf T-Test).
Ein interaktives Tool zum Verstehen der statistischen Leistung finden Sie hier . Beachten Sie, dass sich die statistische Leistung mit der Stichprobengröße ändert!
quelle
Denken Sie in Proportionen darüber nach. Nehmen wir an, dass das Bevorzugen einer Orange ein Erfolg ist, während das Bevorzugen eines Apfels ein Misserfolg ist. Ihre mittlere Erfolgsrate ist also Erfolgeμ=# of sucessesn
Der Standardfehler dieser Größe wird auf geschätztμ(1−μ)n−−−−−√ ≈.155 ≈.0155
quelle
Dieses Konzept ist eine Konsequenz des Gesetzes der großen Zahlen . Aus Wikipedia ,
Die Ergebnisse einer kleinen Stichprobe können vom erwarteten Wert weiter entfernt sein als die Ergebnisse einer größeren Stichprobe. Und so sollte man, wie in der Frage ausgeführt, vorsichtig mit Ergebnissen umgehen, die aus kleinen Stichproben berechnet wurden. Die Idee wird auch in diesem youTube-Video ziemlich gut erklärt .
quelle
Wir sind in der Lage, eine Populationsmenge durch eine Stichprobenmenge abzuschätzen. In diesem Fall verwenden wir Stichprobenanteile, um die Bevölkerungsanteile zu schätzen, aber das Prinzip ist wesentlich allgemeiner.
Wenn wir immer größere Stichproben nehmen (unter Verwendung von Zufallsstichproben), tendieren die Stichprobenmittel zur Konvergenz mit dem Populationsmittelwert. (Dies ist das Gesetz der großen Zahlen.)
Wir möchten jedoch wirklich eine Vorstellung davon haben, wie weit wir entfernt sein könnten (z. B. durch die Breite eines Konfidenzintervalls für den Anteil oder durch die Fehlergrenze, die normalerweise die Hälfte einer solchen Breite beträgt). .
Infolgedessen sind wir zuversichtlicher in Bezug auf die Genauigkeit unserer Schätzung, wenn die Stichprobe groß ist - wenn wir unser Experiment erneut wiederholen, würden andere derartige Mittel dem aktuellen nahe kommen -, und sie gruppieren sich immer enger Da unsere Schätzung (in diesem Fall) unbefangen ist, gruppieren sie sich um die Werte, die wir schätzen möchten. Ein einzelner Stichprobenmittelwert wird immer aussagekräftiger, wo sich der Mittelwert der Grundgesamtheit befinden könnte.
quelle
Eine Faustregel für das "Zählen" von Statistiken, wie das Zählen der Anzahl von Personen, die Orangen mögen, oder das Zählen der Anzahl von "Klicks" in einem Geigerzähler aufgrund des radioaktiven Zerfalls, lautet, dass die Fehlerquote für die Zählung ungefähr das Quadrat ist -Stamm des erwarteten Zählwerts. Es sind Zählstatistiken bekannt, die Poisson-Statistiken sind.
Die Quadratwurzel von 6 ist 2,4-ish, die Fehlertoleranz beträgt also etwa 40% (2,4 / 6). Die Quadratwurzel von 600 ist 24-ish, die Fehlerquote beträgt also ungefähr 4% (24/600). Aus diesem Grund ist das Zählen von 600 wichtiger als das Zählen von 6. Der relative Fehler beträgt ein Zehntel.
Ich bin ein wenig nachlässig in Bezug auf die Definition der Fehlergrenze. Es ist wirklich der 1-Sigma-Wert und kein harter Grenzwert, aber es ist der Bereich, in dem Sie erwarten, dass die meisten (68%) der Messungen liegen. Wenn Sie also 6 Orangenfresser erwarten, erwarten Sie eine Reihe von Umfragen, die Ihnen hauptsächlich Zahlen im Bereich von 4 bis 8 liefern, wie 6,6,5,6,7,2,4,6,3,5,6. 6,7,6,10,8,6,5,6,6,9,3,7,8.
quelle
Ich habe nicht den Namen, den Sie suchen, aber das Problem ist nicht statistisch. Die Art und Weise, wie Menschen Zahlen in unserem Gehirn verarbeiten, gibt größeren Zahlen mehr Gewicht (Autorität) als kleineren Zahlen, da die Größe (physische Größe) visuell genauso wichtig ist wie der repräsentative Wert. Somit erscheint 600/1000 glaubwürdiger als 6/10. Aus diesem Grund bevorzugen Käufer 10% Rabatt! für Werte unter 100 und "Sparen Sie $ 10!" für Werte über 100 (als "100er-Regel" bezeichnet). Es geht darum, wie unser Gehirn auf Wahrnehmung reagiert.
Ein erstaunlicher Blick auf diese und ähnliche Phänomene wird von Nick Kolenda in seiner Online-Abhandlung " Ein enormer Leitfaden zur Preispsychologie " behandelt.
quelle
Während die tatsächliche Fehlerquote wichtig ist, liegt der Grund dafür, dass sie überzeugender klingt , in einer heuristischeren Erfahrung (Faustregel) mit Menschen. Die tatsächliche Fehlerquote bestätigt, dass diese Heuristik sinnvoll ist.
Wenn die Stichprobe 6 für und 4 gegen ist, kann dies 50/50 sein, wenn eine einzelne Person ihre Stimme ändert oder eine einzelne Person irrtümlich erfasst wurde. Es gibt nur noch zwei Personen auf der 6 Seite. Jeder kennt zwei Flocken, jeder weiß, dass die Probe geerntet werden könnte: Sie haben nur Kellnerinnen und sonst niemanden gefragt. Oder Sie haben nur 10 Hochschulprofessoren in den Hallen einer Universität befragt. Oder Sie haben 10 wohlhabende Leute außerhalb der Saks Fifth Avenue gefragt.
Sogar die mathematische Fehlerquote setzt echte Zufälligkeit voraus und berücksichtigt keine Auswahlverzerrung oder Selbstauswahlverzerrung oder irgendetwas anderes, was die Leute intuitiv verstehen können.
Im Gegensatz dazu hat das Ergebnis von 600 vs. 400 mehr Menschen auf der einen Seite als auf der anderen, und 100 Menschen müssten ihre Meinung ändern. Es ist sehr schwierig (aber nicht unmöglich), diese Zahlen durch einen Unfall zu ermitteln, bei dem Sie Umfragen durchgeführt haben, wie Sie die Leute dazu gebracht haben, sich zu einigen, wie Einzelpersonen die Frage verstanden oder interpretiert haben usw.
Es ist überzeugender, nicht weil es sich um einen mathematischen Beweis handelt, sondern weil wir aus Erfahrung wissen, dass Massen von 1000 Menschen sehr viel wahrscheinlicher in ihren Meinungen (zu irgendetwas) verschieden sind als eine Gruppe von 10 Personen (es sei denn, Sie haben dies heimlich getan) Ihre Wahl bei einem Parteitag oder einer KKK-Kundgebung oder etwas anderes, das wahrscheinlich eine einseitige Menge anzieht).
Die Mathematik quantifiziert nur genau das, was wir bereits durch Intuition wissen; dass es einfacher ist, zufällig auf ein oder zwei von 10 Streustimmen zu stoßen, als auf 100 oder 200 von 1000 Streustimmen.
quelle
Was nicht erwähnt wurde, ist die Betrachtung des Problems aus bayesianischer Sicht.
Bitte beachten Sie, dass diese Darstellungen , obwohl sie denen von david25272 ähneln, etwas ganz anderes darstellen .
quelle
Die kurze Antwort:
Im Grunde ist es mehr davon zu überzeugen , weil 600 von 1000 als sechs von 10 zu haben, bei gleichen Einstellungen ist es weit eher für 6 von 10 durch Zufall auftreten.
Nehmen wir an, dass der Anteil, der Orangen und Äpfel bevorzugt, tatsächlich gleich ist (also jeweils 50%). Nennen Sie dies eine Nullhypothese. Bei diesen gleichen Wahrscheinlichkeiten ist die Wahrscheinlichkeit der beiden Ergebnisse:
(Der Einfachheit halber gehe ich von einer unendlichen Population aus, aus der eine unbegrenzte Anzahl von Proben gezogen werden kann.)
Eine einfache Herleitung
Eine Möglichkeit, dieses Ergebnis abzuleiten, besteht darin, einfach die möglichen Kombinationsmöglichkeiten der Personen in unseren Stichproben aufzulisten:
Für zehn Personen ist es einfach:
Ziehen Sie Stichproben von 10 Personen nach dem Zufallsprinzip aus einer unendlichen Anzahl von Personen mit den gleichen Vorlieben für Äpfel oder Orangen in Betracht. Bei gleichen Vorlieben ist es einfach, alle möglichen Kombinationen von 10 Personen aufzulisten:
Hier ist die vollständige Liste.
r ist die Anzahl der Ergebnisse (Personen, die Orangen bevorzugen), C ist die Anzahl der möglichen Arten, wie viele Personen Orangen bevorzugen, und p ist die resultierende diskrete Wahrscheinlichkeit dafür, dass viele Personen in unserer Stichprobe Orangen bevorzugen.
(p ist nur C geteilt durch die Gesamtzahl der Kombinationen. Beachten Sie, dass es insgesamt 1024 Möglichkeiten gibt, diese beiden Präferenzen anzuordnen (dh 2 hoch 10).
(Im Allgemeinen geht es um n Cr- Kombinationen von Ergebnissen r aus einer Stichprobe von n Personen. Es gibt Online-Taschenrechner, mit denen Sie diese Zahlen überprüfen können.)
Diese Liste ermöglicht es uns, die obigen Wahrscheinlichkeiten mit nur einer Division anzugeben. Es besteht eine 21% ige Chance, dass 6 Personen in die Stichprobe aufgenommen werden, die Orangen bevorzugen (210 von 1024 der Kombinationen). Die Wahrscheinlichkeit, sechs oder mehr Personen in unsere Stichprobe aufzunehmen, beträgt 38% (die Summe aller Stichproben mit sechs oder mehr Personen oder 386 von 1024 Kombinationen).
Grafisch sehen die Wahrscheinlichkeiten so aus:
Bei größeren Zahlen nimmt die Anzahl der möglichen Kombinationen schnell zu.
Für eine Stichprobe von nur 20 Personen gibt es 1.048.576 mögliche Stichproben, alle mit gleicher Wahrscheinlichkeit. (Hinweis: Ich habe nur jede zweite Kombination unten gezeigt).
Es gibt immer noch nur eine Probe, bei der alle 20 Menschen Orangen bevorzugen. Kombinationen mit gemischten Ergebnissen sind sehr viel wahrscheinlicher, da die Personen in den Stichproben auf viel mehr Arten kombiniert werden können.
Verzerrte Stichproben sind viel unwahrscheinlicher, nur weil weniger Personenkombinationen zu diesen Stichproben führen können:
Mit nur 20 Personen in jeder Stichprobe sinkt die kumulative Wahrscheinlichkeit, dass 60% oder mehr (12 oder mehr) Personen in unserer Stichprobe Orangen bevorzugen, auf nur 25%.
Es ist zu sehen, dass die Wahrscheinlichkeitsverteilung dünner und größer wird:
Mit 1000 Leuten sind die Zahlen riesig
Wir können die obigen Beispiele auf größere Stichproben ausweiten (aber die Zahlen wachsen zu schnell, als dass es möglich wäre, alle Kombinationen aufzulisten), stattdessen habe ich die Wahrscheinlichkeiten in R berechnet:
Die kumulative Wahrscheinlichkeit, dass 600 oder mehr von 1000 Menschen Orangen bevorzugen, liegt bei nur 1,364232e-10.
Die Wahrscheinlichkeitsverteilung ist jetzt viel konzentrierter um das Zentrum:
[
(Um beispielsweise die Wahrscheinlichkeit zu berechnen, dass genau 600 von 1000 Personen Orangen in R bevorzugen
dbinom(600, 1000, prob=0.5)
, entspricht dies 4,633908e-11, und die Wahrscheinlichkeit von 600 oder mehr Personen1-pbinom(599, 1000, prob=0.5)
entspricht 1,364232e-10 (weniger als 1 in einer Milliarde).quelle
Dies liegt daran, dass eine höhere Zahl eine größere Genauigkeit gewährleistet. Zum Beispiel, wenn Sie 1000 zufällige Personen von irgendwo auf dem Planeten aufnehmen würden und 599 von ihnen männlich gegen 10 zufällige Personen mit 6 männlich sind, wäre der erstere genauer. Wenn Sie eine Bevölkerung von 7 Milliarden Menschen annehmen und die Anzahl der Männer berechnen, erhalten Sie eine genauere Zahl, die offensichtlich überzeugender ist als bei nur 1000 Menschen.
quelle