Warum soll / soll (?) Die statistische Erhebung für die Politik funktionieren (zB Gallup)?

14

Umfragen (sagen wir Gallup) haben eine absurd niedrige Anzahl von Menschen im Vergleich zur Bevölkerungszahl ergeben (z. B. vielleicht tausend von Hunderten von Millionen Menschen).

Für mich ist die Auswahl einer Population als Mittel zur Schätzung der Bevölkerungsstatistik sinnvoll, wenn Sie einen starken Grund zu der Annahme haben, dass die Stichproben repräsentativ für die Population (oder ähnlich für andere Stichproben ) sind .

Zum Beispiel ist die Probenahme für medizinische Studien offensichtlich sinnvoll, da wir a priori wissen, dass alle Menschen ein sehr ähnliches Genom haben und dass dieser Faktor bewirkt, dass sich ihr Körper ähnlich verhält.
Beachten Sie, dass dies keine lose Kopplung ist - das Genom ist ein verdammt stark bestimmender Faktor .

Ich verstehe jedoch einfach nicht, was es rechtfertigt, niedrige Stichprobengrößen für politische Umfragen zu verwenden.

Ich könnte mir vorstellen, dass vielleicht 80-90% der Menschen in einer bestimmten Nachbarschaft ähnlich für den Präsidenten stimmen (aufgrund ähnlicher sozioökonomischer / bildungsbezogener Hintergründe), aber dies scheint die absurd niedrige Anzahl von Stichproben kaum zu rechtfertigen. Es gibt buchstäblich keinen zwingenden Grund (zumindest für mich), warum 1000 zufällige Wähler sich wie die 200 Millionen anderen Wähler verhalten sollten.

Für mich bräuchten Sie mindestens das 100-fache dieses Betrags. Warum? Ich kann mir eine Reihe von Gründen vorstellen, zB:

  1. Es gibt ~ 22.000 Bezirke nur in Kalifornien . Die Menschen wachsen in ihren wirtschaftlichen und schulischen Verhältnissen so unterschiedlich auf, dass eine Umfrage der Größe 1000 lächerlich klein erscheint. Wie kann man ganze Bezirke mit durchschnittlich <1 Person zusammenfassen?

  2. Menschen können die Reaktionen ihres Körpers auf die Medizin im Allgemeinen nicht ändern, aber sie können ihre Ansichten über die Politik ändern, indem sie nur darüber nachdenken. So wie ich das sehe, gibt es in der Medizin keinen ähnlichen Faktor wie DNA, wenn Sie sich mit Politik beschäftigen. Am besten würde ich mir vorstellen , sollte es kleine Taschen von Korrelation sein.

Doch irgendwie scheinen Umfragen wie diese ... trotzdem zu funktionieren? Oder zumindest scheinen die Leute zu glauben, dass sie es tun?
Aber warum sollten sie? Vielleicht verstehe ich Sampling einfach nicht ? Kann das jemand erklären?
Ich kann keine der Umfragen, die ich sehe, ernst nehmen, aber ich fühle mich in dieser Sache mehr oder weniger allein ...

user541686
quelle
4
"Die Probenahme ist für medizinische Studien offensichtlich sinnvoll, da wir a priori wissen, dass alle Menschen ein sehr ähnliches Genom haben." Ich habe keinen medizinischen Hintergrund, aber unterscheidet sich unsere DNA tatsächlich weniger von unseren politischen Ansichten? Wenn ja, warum ist es so schwierig, Genetik zu studieren, und warum hatten wir nicht bereits ein umfassendes Verständnis davon? Ich würde wetten, dass wenn Sie zwei zufällige Personen nehmen, diese mit größerer Wahrscheinlichkeit dieselben politischen Ansichten und dieselbe DNA vertreten.
Tim
3
@Tim: "Ich würde wetten, dass wenn Sie zwei zufällige Personen nehmen, diese mit größerer Wahrscheinlichkeit dieselben politischen Ansichten und dieselbe DNA vertreten." Wie viel willst du wetten? google.com/search?q=dna+ähnlichkeit+zwischen+menschen
user541686
2
Aber ist nicht die 0,5% Unterschied der wichtigste Sache , wenn Sie solche Vergleiche? Außerdem teilen wir 60% der Gene mit Fliegen , sodass wir vermutlich Menschen und Fliegen austauschbar für die medizinische Forschung untersuchen könnten. Im Vergleich: 2008 erhielt Obama bei den US-Präsidentschaftswahlen 53% der Stimmen. Ich würde außerdem argumentieren , dass , wenn lebensrettende Erforschung aber potenziell gefährliche Droge , die Sie sollte mehr vorsichtig dann bei der Abtastung , wenn für die Verwendung von Seife , hergestellt von Firma A gegen B Forschung über Vorlieben zu tun, oder für Meinungs Pools.
Tim
2
@ user2338816: "Es ist überzeugend, weil es historisch korrekt war" ist weniger wie Mathematik, sondern eher wie Naturwissenschaften. Ich bin völlig bereit, es aus wissenschaftlichen Gründen zu kaufen (weil die Wissenschaft so handelt), aber nicht aus rein mathematischen (beweisbasierten) Gründen.
user541686
1
Ich würde die (vorsichtige) Behauptung anfechten, dass Umfragen für Wahlen funktionieren. Ich kann mich nicht erinnern, dass Umfragen den tatsächlichen Ergebnissen der Wahlen, aus denen ich stamme, nahe gekommen sind. Es gibt einfach zu viele Faktoren, die Sie nicht wirklich erklären können - zum Beispiel, mit unserer Anwesenheit von ~ 60%, werden Sie fast genauso wahrscheinlich jemanden befragen, der nicht wählen wird, als jemanden, der nicht wählen wird. Die Teilnahme an einer Umfrage ist weniger aufwändig als das Abstimmen, und manchmal wird man sogar dafür bezahlt. Einige Parteien sind viel stärker vertreten als andere (wie die Kommunistische Partei). Bei jeder Stichprobe müssen Sie sowohl die Abweichung als auch die "Ergebnisse" angeben.
Luaan

Antworten:

13

Anscheinend stellen Sie sich ein sehr einfaches Stichprobenmodell vor.

Das einfachste Modell für die Stichprobe heißt treffend einfache Zufallsstichprobe . Sie wählen eine Untergruppe der Bevölkerung aus (z. B. indem Sie zufällig Telefonnummern wählen) und fragen, wer antwortet, wie diese abstimmen. Wenn 487 Clinton sagen, 463 Trump und der Rest Ihnen eine verrückte Antwort gibt, dann würden die Umfragegesellschaft berichten, dass 49% der Wähler Clinton bevorzugen, während 46% Trump bevorzugen. Die Wahlbüros tun jedoch noch viel mehr. Eine einfache Zufallsstichprobe gibt jedem Datenpunkt das gleiche Gewicht. Nehmen wir jedoch an, Ihre Stichprobe enthält zufällig 600 Männer und 400 Frauen, was eindeutig nicht repräsentativ für die Gesamtbevölkerung ist. Wenn Männer als Gruppe in die eine Richtung tendieren, während Frauen in die andere Richtung tendieren, wird dies Ihr Ergebnis beeinflussen. Da wir jedoch ziemlich gute Bevölkerungsstatistik haben, können Sie Gewicht *die Antworten, indem die Antworten der Frauen etwas mehr und die der Männer etwas weniger gezählt werden, so dass die gewichtete Antwort die Bevölkerung besser repräsentiert. Meinungsforschungsinstitute haben kompliziertere Wägemodelle, die eine nicht repräsentative Stichprobe repräsentativer machen können.

Die Idee, die Stichprobenantworten zu gewichten, stützt sich auf eine recht solide statistische Grundlage, es besteht jedoch eine gewisse Flexibilität bei der Auswahl der Faktoren, die zur Gewichtung beitragen. Die meisten Umfrageteilnehmer gewichten aufgrund demografischer Faktoren wie Geschlecht, Alter und Rasse neu. Vor diesem Hintergrund könnte man denken , dass die Parteiidentifikation (demokratisch, republikanisch, usw.) sollten ebenfalls einbezogen werden, aber es stellt sich heraus , dass die meisten Wahl Firmen haben nicht verwenden es in ihren Gewichten: Partei (Selbst-) -Kennzeichnung wird mit dem Wähler die Wahl verheddert auf eine Weise, die es weniger nützlich macht.

Viele Umfrageteams melden ihre Ergebnisse auch unter "wahrscheinlichen Wählern". Dabei werden die Befragten entweder ausgewählt oder gewichtet, basierend auf der Wahrscheinlichkeit, dass sie tatsächlich an den Umfragen teilnehmen. Dieses Modell ist zweifellos auch datengetrieben, aber die genaue Auswahl der Faktoren ermöglicht eine gewisse Flexibilität. Das Einbeziehen von Interaktionen zwischen dem Kandidaten und der Rasse (oder dem Geschlecht) des Wählers war zum Beispiel bis 2008 oder 2016 nicht einmal sinnvoll, aber ich vermute, dass sie jetzt eine gewisse Vorhersagekraft haben.

Theoretisch können Sie alle möglichen Faktoren als Gewichtungsfaktoren einbeziehen: Musikalische Vorlieben, Augenfarbe usw. Demografische Faktoren sind jedoch beliebte Optionen für Gewichtungsfaktoren, weil:

  • Empirisch korrelieren sie gut mit dem Wahlverhalten. Offensichtlich gibt es kein eisernes Gesetz, das "weiße Männer zwingt", schlanke Republikaner zu sein, aber in den letzten fünfzig Jahren tendierten sie dazu.
    • Die Populationswerte sind allgemein bekannt (z. B. aus der Volkszählung oder aus Vital Records).

Umfrageteilnehmer sehen jedoch auch die gleichen Nachrichten wie alle anderen und können die Gewichtungsvariablen bei Bedarf anpassen.

Es gibt auch einige "Fudge-Faktoren", die manchmal zur Erklärung der Umfrageergebnisse herangezogen werden. Beispielsweise zögern die Befragten manchmal, "sozial unerwünschte" Antworten zu geben. Der Bradley-Effekt besagt, dass weiße Wähler manchmal ihre Unterstützung für weiße Kandidaten, die gegen eine Minderheit antreten, herunterspielen, um nicht rassistisch zu wirken. Es ist nach Tom Bradley benannt, einem afroamerikanischen Gouverneurskandidaten, der die Wahl knapp verloren hat, obwohl er in den Umfragen bequem an der Spitze stand.

Schließlich haben Sie völlig Recht, dass die bloße Frage nach der Meinung einer Person dies ändern kann. Wahlbüros versuchen, ihre Fragen neutral zu formulieren. Um Probleme mit der Reihenfolge der möglichen Antworten zu vermeiden, werden die Namen der Kandidaten möglicherweise in zufälliger Reihenfolge aufgelistet. Manchmal werden auch mehrere Versionen einer Frage gegeneinander getestet. Dieser Effekt kann auch für schändliche Zwecke in einer Push-Umfrage ausgenutzt werden , bei der der Interviewer eigentlich nicht daran interessiert ist, Antworten zu sammeln, sondern sie zu beeinflussen. In einer Push-Umfrage könnte beispielsweise die Frage gestellt werden, ob Sie für [Kandidat A] stimmen würden, auch wenn gemeldet wurde, dass er ein Kinderschänder war.


* Sie können auch explizite Ziele für Ihre Stichprobe festlegen, z. B. 500 Männer und 500 Frauen. Dies wird als geschichtete Stichprobe bezeichnet - die Population wird in verschiedene Gruppen geschichtet, und jede Gruppe wird dann nach dem Zufallsprinzip beprobt. In der Praxis wird dies bei Umfragen nicht sehr häufig durchgeführt, da Sie sich in viele vollständige Gruppen einteilen müssen (z. B. Männer mit Hochschulabschluss zwischen 18 und 24 Jahren in Urban Texas).

Matt Krause
quelle
2
Ich verstehe , auf jeden Fall sind sich nicht einfache Zufallsauswahl tun, aber meine Frage ist , ob das, was sie sind , tun einfach nur gut ist , nur weil es geschieht , dass ihre Annahmen korrekt sind (dh ein angemessenes , aber subjektives Gefühl), oder ob die Annahmen sind auch statistisch gerechtfertigt. Siehe meinen Kommentar zur anderen Antwort hier .
user541686
3
Ich denke beides. Die Gewichtung der Stichprobe ist statistisch korrekt, aber es gibt Flexibilität bei der Auswahl, welche Faktoren in die Gewichtung einfließen. Zum Beispiel sind Rasse, Geschlecht und Bildung alle nützlich, aber es stellt sich heraus, dass die Identifizierung der Partei häufig nicht möglich ist (z. B. theguardian.com/commentisfree/2012/sep/27/… ), wahrscheinlich weil sie mit dem Kandidaten des Wählers verknüpft ist Wahl.
Matt Krause
1
In ähnlicher Weise beinhalten die Gewichte manchmal eine Schätzung der Wahrscheinlichkeit, mit der der Befragte abstimmt: Jugendliche machen viel Lärm, tauchen jedoch nicht immer auf; Ältere nehmen selten an Kundgebungen teil, nehmen aber zuverlässig an den Wahlen teil. Dies könnte aus historischen Daten geschätzt werden (Wählerlisten sind manchmal öffentlich), aber ich könnte mir vorstellen, dass einige Orte dies für Afroamerikaner im Jahr 2008 und für Frauen im Jahr 2016 angepasst haben.
Matt Krause,
Vielen Dank! Könnte gut zu erwähnen sein, dass "Flexibilität" in Ihrer Antwort auch :) +1
user541686
10

Es gibt ein mathematisches Theorem, das "Gesetz der großen Zahlen" genannt wird. Stellen Sie sich vor, Sie möchten die Wahrscheinlichkeit bestimmen, dass eine Münze auf den Kopf kommt. Die "Bevölkerung" der Münzwürfe ist unendlich - viel größer als die über 300.000.000 Menschen in den Vereinigten Staaten. Aber nach dem Gesetz der großen Zahlen ist Ihre Schätzung umso genauer, je mehr Münzen geworfen werden.

Die ideale Umfrage: Bei der idealen Umfrage würden die Umfrageteilnehmer nach dem Zufallsprinzip Namen aus der US-Volkszählung auswählen, herausfinden, wo diese Menschen leben, und dann an ihre Tür klopfen. Wenn die Person sagt, dass sie abstimmen will, fragt der Umfrageteilnehmer, für wen sie abstimmen, und zeichnet ihre Antwort auf. Es ist mathematisch garantiert, dass eine solche Abfrage funktioniert, und die Fehlermenge in Ihrer Messung für ein bestimmtes Konfidenzniveau kann leicht berechnet werden .

Das bedeutet der Fehler: Angenommen, Sie haben laut Ihrer Umfrage eine 52-prozentige Chance, dass Candidate Awesome McPerfect mit 3% Fehler und 98% Selbstvertrauen gewinnt. Das bedeutet, dass Sie zu 98% sicher sein können, dass der wahre Anteil der Wähler, die den Kandidaten Awesome McPerfect favorisieren, zwischen 49% und 55% liegt.

Ein Hinweis zu Fehler und Zuverlässigkeit Je zuverlässiger Sie bei einer bestimmten Stichprobengröße sind, desto größer ist der Fehler. Denken Sie darüber nach - Sie sind zu 100% davon überzeugt, dass der wahre Anteil, der Canditate Awesome unterstützt, zwischen 0% und 100% liegt (größtmöglicher Fehler), und Sie sind zu 0% davon überzeugt, dass der wahre Anteil, der Canditate Awesome unterstützt, genau 52.0932840985028390984308% ist. (Null Fehler). Mehr Vertrauen bedeutet mehr Fehler, weniger Vertrauen bedeutet weniger Fehler. Das Verhältnis zwischen Vertrauen und Fehler ist jedoch NICHT linear! (Siehe: https://en.wikipedia.org/wiki/Confidence_interval )

Umfragen in der realen Welt: Weil es teuer ist, mit dem Hubschrauber in alle Teile des Landes zu fliegen, um an die Türen zufälliger Leute zu klopfen (obwohl ich das gerne sehen würde; wenn Sie ein Milliardär sind und Sie das sehen, bitte Betrachten Sie die Finanzierung dieses), sind Umfragen in der realen Welt komplexer. Schauen wir uns eine der gebräuchlichsten Strategien an: Sie rufen zufällige Wähler auf und fragen sie, wen sie wählen würden. Es ist eine gute Strategie, aber es gibt einige bekannte Fehler:

  1. Leute entscheiden sich oft dafür, nicht ans Telefon zu gehen und auf Meinungsforscher zu antworten (z. B. ich)
  2. Einige Bevölkerungsgruppen haben mit größerer Wahrscheinlichkeit einen Festnetzanschluss (z. B. ältere Wähler).
  3. Einige Bevölkerungsgruppen reagieren eher auf Meinungsumfragen (z. B. ältere Wähler).

Da unterschiedliche Bevölkerungsgruppen unterschiedlich abstimmen, müssen die Umfrageteilnehmer ihr Bestes tun, um die Unterschiede in ihren Rohdaten (basierend darauf, wer sich für den Anrufbeantworter entschieden hat) und den Ergebnissen der tatsächlichen Wahlen zu kontrollieren. Wenn zum Beispiel 10% der Personen, die das Telefon abgenommen haben, Hispanoamerikaner waren, aber 30% der Wähler bei der letzten Wahl Hispanoamerikaner, dann werden sie in ihrer Umfrage den Hispanoamerikanern das dreifache Gewicht beimessen. Wenn 50% der Personen, die am Telefon geantwortet haben, älter als 60 Jahre waren, aber nur 30% der Personen, die bei der letzten Wahl gewählt haben, älter als 60 Jahre, werden sie den älteren Wählern, die geantwortet haben, weniger Gewicht beimessen. Es ist nicht perfekt, aber es kann zu einigen beeindruckenden Vorhersagetaten führen (Nate Silver hat die Ergebnisse in jedem der 50 Bundesstaaten bei den Wahlen 2012 mithilfe von Statistiken richtig vorhergesagt).

Ein Wort der Vorsicht für die Weisen: Die Umfrageteilnehmer treffen die besten Vorhersagen, die sie auf der Grundlage der bisherigen Entwicklungen treffen können. Im Allgemeinen funktionieren die Dinge ungefähr so ​​wie in der Vergangenheit, oder zumindest ist die Veränderung langsam genug, dass die jüngste Vergangenheit (auf die sie sich am meisten konzentrieren) der Gegenwart ähnelt. Gelegentlich kommt es jedoch zu schnellen Veränderungen in der Wählerschaft, und die Dinge laufen schief. Vielleicht ist die Wahrscheinlichkeit, dass Trump-Wähler ans Telefon gehen, etwas geringer als die eines durchschnittlichen Wählers, und die Gewichtung nach demografischen Merkmalen trägt nicht dazu bei. Oder vielleicht sind junge Leute (die Hillary mit überwältigender Mehrheit unterstützen) noch mehrEs ist unwahrscheinlich, dass der Anruf entgegengenommen wird, als die Modelle vorhersagen, und diejenigen, die den Anruf entgegennehmen, sind mit größerer Wahrscheinlichkeit Republikaner. Oder vielleicht ist das Gegenteil von beidem der Fall - wir wissen es nicht. Solche Dinge sind versteckte Variablen, die in häufig gesammelten demografischen Daten nicht angezeigt werden.

Wir würden wissen, ob wir Meinungsforscher schicken, die an zufällige Türen klopfen sollen (ähm, imaginäre Milliarden lesen das), dann müssten wir die Dinge nicht nach demografischen Gesichtspunkten gewichten, aber bis dahin drücken wir die Daumen.

J. Antonio Perez
quelle
3
Ich schätze die Antwort, aber sie ist ein bisschen elementar im Vergleich zu der Frage, die ich stellen wollte, und meinem Hintergrund (nicht sicher, ob Sie es bemerkt haben, aber die Grundlagen der Wahrscheinlichkeit / Statistik sind mir nicht ganz neu). Ich glaube nicht, dass die Antwort auf meine Frage so einfach ist wie deine. Zum Beispiel: Eine Annahme für das klassische Gesetz der großen Zahlen ist, dass wir Zufallsvariablen mit identischen Verteilungen haben ... aber ich sehe keine Rechtfertigung dafür in einem politischen Kontext: Warum sollte die Verteilung, die Sie mir und Ihnen geben, Ihre sein? das gleiche überhaupt ?
User541686
Ich bin mir auch nicht sicher, ob das Gesetz der großen Zahlen die Sache rechtfertigt, die Sie zu rechtfertigen versuchten, auch wenn seine Annahmen erfüllt sind. Die Frage betrifft Stichprobengrößen, die das Gesetz der großen Zahlen nicht wirklich behandelt (zumindest nicht in der von Ihnen vorgeschlagenen Weise). Wir brauchen hier eine Vorstellung von der Varianz oder Konvergenzrate, nicht nur von der Konvergenz des Mittelwerts im Unendlichen. Vielleicht wollten Sie lieber den zentralen Grenzwertsatz als das Gesetz der großen Zahlen verwenden? (Bitte
beachten
2
Verteilungen gelten nicht für Einzelstimmen. Einzelne Stimmen sind nicht zufällig. Sie werden auf das Wahlverhalten der gesamten Bevölkerung angewendet. Es ist wie das Zeichnen von farbigen Kugeln aus einer Urne - jede Kugel ist als rot oder blau vorbestimmt, aber Sie können die Wahrscheinlichkeit haben, jede Farbe zu zeichnen, und so eine Verteilung für die Wahrscheinlichkeit des Zeichnens einer bestimmten Kugelfarbe basierend auf einer Probe erstellen der Bälle in der Urne
J. Antonio Perez
1
Betrachten wir etwas anderes als Politik mit Menschen. Jemandes Lieblingsgeschmack von Eis hängt von genauso vielen Dingen ab wie von seinen politischen Ansichten. Es könnte von den Vorlieben ihrer Freunde, guten Erinnerungen an ihre Kindheit, guten oder schlechten Erfahrungen in der Eisdiele abhängen. Vielleicht mögen sie einen Geschmack, weil sie ihn beim ersten Date mit ihrer Frau oder ihrem Ehemann bekommen haben. Vielleicht mögen sie ein Aroma nicht, weil es sie an ihre Ex erinnert. Aber wenn ich eine zufällige Umfrage unter Leuten in Amerika machen würde, würden Sie mir nicht zustimmen, dass ich die beliebtesten Eisgeschmacksrichtungen in Amerika beurteilen könnte?
J. Antonio Perez
1
Die "Zufallsvariable" ist die Person, die vom Meinungsforscher ausgewählt wird, um nach ihrer Präferenz gefragt zu werden. Die Präferenz eines Individuums ist nicht zufällig; Welche Person der Meinungsforscher auswählt, ist zufällig.
J. Antonio Perez
7

Erstens ist dies abgesehen von Ihren Hauptpunkten, aber es ist erwähnenswert. In der medizinischen Studie könnten 1000 Menschen ein Medikament testen, das 10000 Kranken pro Jahr verabreicht werden kann. Sie könnten sich das ansehen und denken: "Das wird an 10% der Bevölkerung getestet." Tatsächlich sind es nicht 10000 Menschen, sondern nur zukünftige Patienten. Die Bevölkerungszahl ist also unendlich. 1000 Menschen sind nicht groß im Vergleich zu den unendlichen potentiellen Konsumenten der Droge, aber diese Art von Studien funktionieren. Es ist nicht wichtig, ob Sie 10%, 1% oder 0,1% der Bevölkerung testen. Was wichtig ist, ist die absolute Größe der Stichprobe und nicht, wie groß sie im Vergleich zur Grundgesamtheit ist.

Als nächstes geht es hauptsächlich darum, dass es so viele verwirrende Variablen gibt, die das Abstimmen von Menschen beeinflussen können. Sie behandeln die 22000 Bezirke Kaliforniens wie 22000 Variablen, aber in Wirklichkeit handelt es sich nur um eine Handvoll Variablen (Einkommen und Bildung, wie Sie erwähnt haben). Sie benötigen keine repräsentative Stichprobe aus jedem Distrikt, Sie benötigen nur genügend Stichproben, um die Schwankungen aufgrund von Einkommen, Bildung usw. abzudecken.

kknnσ2nkkσ2n

kn

Bearbeiten:

Die obige Formel ging davon aus, dass jede Störgröße gleich wichtig ist. Wenn wir Hunderte von Dingen berücksichtigen möchten, die zu einer Varianz der Ergebnisse führen können, ist diese Annahme nicht gültig (z. B. unterstützen Twitter-Benutzer möglicherweise einen Kandidaten mehr, aber wir wissen, dass die Verwendung von Twitter nicht so wichtig ist wie das Geschlecht).

σ20.9σ20.92σ2n=0σ20.9n=10σ2

n10σ2n0.9 wurde willkürlich gewählt, aber dies vermittelt einen Punkt darüber, wie sich diese unendliche Anzahl von Nebenvariablen zu etwas Kleinem summieren sollte

Hugh
quelle
Danke für die Antwort! In Bezug auf den ersten Punkt denke ich, dass das stimmt, aber mein Punkt war, dass es nicht einmal wichtig ist, wie groß die menschliche Bevölkerung ist, da Sie einen erzwingenden Faktor (DNA usw.) haben, der die Ergebnisse für ziemlich ähnlich macht irgendeine Probe. Die zweiten in Bezug auf , aber: ich , dass es kaufen könnte einige Variablen in der Praxis sein, aber der einzige Weg , diese Annahme mathematisch zu rechtfertigen und es verwendet , später tatsächlich ist , um eine große Zahl von Menschen zu probieren ersten und demonstriert sie, nicht wahr? Ohne das scheint die Schlussfolgerung nicht mehr statistisch streng oder gerechtfertigt zu sein.
user541686
Wir haben experimentell festgestellt, dass Alter, Geschlecht, Einkommen und einige andere Schlüsselfaktoren für das Abstimmungsmuster der Menschen sind, und wir wissen dies auch nur aus allgemeinem Wissen. Sie haben Recht, dass es Hunderte anderer kleiner Faktoren geben könnte, die die Stimmen beeinflussen, und theoretisch könnten sie sich zu etwas Bedeutendem summieren, aber unser Allgemeinwissen sagt uns, dass sie unwichtig sind. Zum jetzigen Zeitpunkt ist das Modell nicht konsequent gerechtfertigt, aber wer wird kleinere Faktoren wie "Lässt das Tragen einer Perücke Menschen für Clinton stimmen? Lässt das Tragen einer Perücke Menschen für Trump stimmen?" Testen.
Hugh
"aber wer testet schon kleine faktoren wie [...]" - aber das ist hier das problem. Wenn die Antwort lautet "weil es das Beste ist, was wir praktisch machen können / weil es einfach so funktioniert / weil es sonst teuer ist / etc.", Ist das eine perfekte Antwort auf die Frage "Warum befragen sie nicht 100.000 Menschen?" ", aber es ist nicht wirklich eine Antwort auf" Wie können 1.000 Menschen statistisch gerechtfertigt sein? ". Deshalb frage ich dies bei Stats.SE im Gegensatz zu Politics.SE ... Es ist mir egal, ob mehr Proben unpraktisch sind. Meine Frage ist, warum die Leute denken, dass die gegenwärtigen Methoden statistisch gerechtfertigt sind.
user541686
Die ersten paar Sätze im letzten Kommentar scheinen jedoch eine vernünftige Antwort zu sein, wenn Sie sagen, dass diese Art von Studie in großem Maßstab durchgeführt wurde (~ Hunderttausende, wenn nicht Millionen von Menschen) und das ist die Grundlage unserer Annahmen. Wenn ja, denke ich, sollten sie zu Ihrer Antwort hinzugefügt werden, da sie den Kern meiner Frage ansprechen (idealerweise mit einigem Zitat), obwohl ich nicht allzu wählerisch sein kann, da es ein bisschen tangential ist und dies nicht Politics.SE ist ).
user541686
Sie haben Recht, dass das Testen kleinerer Faktoren unpraktisch, aber mathematisch relevant ist. Ich habe meine Antwort überarbeitet, um zu begründen, warum wir uns keine Sorgen über Hunderte kleiner Faktoren machen, die das Ergebnis beeinflussen. Ich bin sicher, Sie können Untersuchungen über den Einfluss des Hauptfaktors finden.
Hugh