So verwenden Sie keine Statistiken

15

Dies ist eine Art offene Frage, aber ich möchte klar sein. Bei einer ausreichenden Bevölkerungszahl können Sie möglicherweise etwas lernen (dies ist der offene Teil), aber was auch immer Sie über Ihre Bevölkerungszahl erfahren, wann ist dies jemals auf ein Mitglied der Bevölkerung anwendbar?

Soweit ich die Statistik verstehe, ist sie jedoch nie auf ein einzelnes Mitglied einer Bevölkerung anwendbar, und so finde ich mich häufig in einer Diskussion wieder, in der die andere Person sagt: "Ich habe gelesen, dass 10% der Weltbevölkerung an dieser Krankheit leidet." schlussfolgern, dass jede zehnte Person im Raum diese Krankheit hat.

Ich verstehe, dass zehn Personen in diesem Raum nicht groß genug sind, um die Statistik relevant zu machen, aber anscheinend viele nicht.

Dann ist da noch etwas über ausreichend große Proben. Sie müssen nur eine ausreichend große Population untersuchen, um zuverlässige Statistiken zu erhalten. Ist dies nicht proportional zur Komplexität der Statistik? Wenn ich etwas messe, das sehr selten ist, bedeutet das nicht, dass ich eine viel größere Stichprobe benötige, um die Relevanz für eine solche Statistik bestimmen zu können?

Die Sache ist, ich bezweifle wirklich die Gültigkeit einer Zeitung oder eines Artikels, wenn es um Statistiken geht. Sie dienen dazu, Vertrauen aufzubauen.

Das ist ein bisschen Hintergrund.

Zurück zur Frage, auf welche Weise können Sie NICHT Statistiken verwenden, um ein Argument zu bilden . Ich habe die Frage verneint, weil ich mehr über häufige Missverständnisse in Bezug auf Statistiken erfahren möchte.

John Leidegren
quelle
2
Dies ist nur eine sehr unvollständige Antwort, daher werde ich sie nicht als Antwort veröffentlichen. Sie haben Recht, dass komplexe Statistiken eine größere Population erfordern. Sie beziehen sich auf das Konzept der "Freiheitsgrade", die einfach die Anzahl der unabhängigen Variablen minus eins ist. Wenn Sie so etwas wie einen p-Test durchführen, hängt Ihre Ablehnungsschwelle zusätzlich zu dem von Ihnen gewählten p-Wert (in der Regel 0,05) von der Anzahl der Freiheitsgrade ab.
2
Wenn mehr Leute Hookes How to Tell the Liars von den Statistikern lesen , wird es vielleicht nicht so viele "statistische Trottel" geben, wie wir jetzt auf der Welt haben.
JM ist kein Statistiker
1
Ich denke, Sie könnten von dieser Frage auf stats stackexchange profitieren. Ich habe die Frage markiert, damit sie möglicherweise dorthin verschoben wird.
InterestedGuest
Ich wusste nicht einmal, dass wir ein Forum für statistische Analysen haben. Ich würde die Frage stellen, wenn ich wüsste wie ...

Antworten:

2

Um Rückschlüsse auf eine bevölkerungsbezogene Gruppe zu ziehen, muss die Gruppe repräsentativ für die Bevölkerung und unabhängig sein. Andere haben dies diskutiert, deshalb werde ich nicht auf dieses Stück eingehen.

Eine andere zu berücksichtigende Sache ist die Nicht-Intuitivität von Wahrscheinlichkeiten. Angenommen, wir haben eine Gruppe von 10 Personen, die unabhängig und repräsentativ für die Bevölkerung sind (Zufallsstichprobe), und wir wissen, dass 10% der Bevölkerung ein bestimmtes Merkmal aufweisen. Daher hat jede der 10 Personen eine 10% ige Chance, die Eigenschaft zu haben. Die allgemeine Annahme ist, dass es ziemlich sicher ist, dass mindestens 1 die Eigenschaft haben wird. Aber das ist ein einfaches Binomialproblem, wir können die Wahrscheinlichkeit berechnen, dass keine der 10 die Charakteristik hat, es ist ungefähr 35% (konvergiert gegen 1 / e für größere Gruppe / kleinere Wahrscheinlichkeit), was viel höher ist, als die meisten Leute vermuten würden. Es besteht auch eine 26% ige Chance, dass 2 oder mehr Personen die Eigenschaft haben.

Greg Snow
quelle
9

Sofern die Personen in dem Raum keine Zufallsstichprobe der Weltbevölkerung sind, werden Schlussfolgerungen, die auf Statistiken über die Weltbevölkerung beruhen, sehr verdächtig sein. Jeder fünfte Mensch auf der Welt ist Chinese, aber keines meiner fünf Kinder ist ...


quelle
6
  1. Um eine Überanwendung der Statistik auf kleine Stichproben zu vermeiden, empfehle ich, mit bekannten Witzen zu kontern ("Ich bin so aufgeregt, meine Mutter ist wieder schwanger und mein Babygeschwister wird chinesisch sein." "Warum?" "Ich habe das jedes vierte Baby gelesen ist Chinesisch. ").

  2. Eigentlich empfehle ich Witze, um alle Arten von Missverständnissen in der Statistik anzugehen, siehe http://xkcd.com/552/ für Korrelation und Ursache.

  3. Das Problem bei Zeitungsartikeln ist selten die Tatsache, dass sie ein seltenes Phänomen behandeln.

  4. Das Paradoxon von Simpsons ist ein Beispiel dafür, dass Statistiken nur selten ohne Analyse der Ursachen verwendet werden können.

Phira
quelle
2
Die Variation des "chinesischen Babys" -Witzes, den ich gehört habe, hatte die werdende Mutter befürchtet, dass ihr Baby als illegaler Ausländer betrachtet und somit abgeschoben werden könnte ...
JM ist kein Statistiker
3

Es gibt einen interessanten Artikel von Mary Gray über den Missbrauch von Statistiken in Gerichtsverfahren und dergleichen ...

Gray, Mary W .; Statistik und Recht. Mathematik. Mag. 56 (1983), no. 2, 67–81

Gerald Edgar
quelle
1

Statistische Analyse oder statistische Daten?

Ich denke, dieses Beispiel in Ihrer Frage bezieht sich auf statistische Daten: "Ich habe gelesen, dass 10% der Weltbevölkerung an dieser Krankheit leiden." Mit anderen Worten, in diesem Beispiel verwendet jemand Zahlen, um die Quantität effektiver zu kommunizieren, als nur "viele Menschen" zu sagen.

Meine Vermutung ist, dass die Antwort auf Ihre Frage in der Motivation der Sprecherin verborgen ist, warum sie Zahlen verwendet. Es könnte sein, eine Idee besser zu kommunizieren oder Autorität zu zeigen oder den Zuhörer zu blenden. Das Gute daran, Zahlen zu nennen, anstatt "sehr groß" zu sagen, ist, dass die Leute die Zahl widerlegen können. Siehe Poppers Idee zur Widerlegung.

b_dev
quelle
0

A

Aσ=c

Aσ

A¬Aσ

Raphael
quelle
0

Soweit ich Statistiken verstehe, ist sie niemals auf ein einzelnes Mitglied einer Population anwendbar

Es ist nicht wahr. Das hängt von der Anwendung ab.

Beispiel: Kernzerfall in der Physik. Die Zerfallsrate definiert die Wahrscheinlichkeit eines Zerfalls jedes einzelnen Kerns . Sie nehmen einen beliebigen Kern und er hat genau dieselbe Zerfallswahrscheinlichkeit, die Sie durch Experimentieren an der Probe ermittelt haben.

Aksakal
quelle