Ich höre sehr gerne einfache Erklärungen zu komplexen Problemen. Was ist Ihre Lieblingsanalogie oder Anekdote, die ein schwieriges statistisches Konzept erklärt?
Mein Favorit ist Murrays Erklärung für die Integration mit einem Betrunkenen und ihrem Hund. Murray erklärt, wie zwei zufällige Prozesse (ein wandernder Betrunkener und ihr Hund Oliver) Einheitswurzeln haben können, aber dennoch miteinander verwandt sind (cointegriert sind), da ihre gemeinsamen ersten Unterschiede stationär sind.
Der Betrunkene macht sich von der Bar auf den Weg, um ziellos und zufällig herumzulaufen. Aber in regelmäßigen Abständen sagt sie "Oliver, wo bist du?" Und Oliver unterbricht sein zielloses Bellen. Er hört sie; sie hört ihn. Er denkt: "Oh, ich kann nicht zulassen, dass sie zu weit weg ist. Sie wird mich aussperren." Sie denkt: "Oh, ich kann nicht zulassen, dass er zu weit weg ist. Er wird mich mitten in der Nacht mit seinem Gebell wecken." Jeder beurteilt, wie weit der andere entfernt ist, und versucht, diese Lücke teilweise zu schließen.
quelle
Ich habe den Weg der Betrunkenen zuvor für einen zufälligen Weg benutzt und den Weg der Betrunkenen und ihres Hundes für die Integration. Sie sind sehr hilfreich (teilweise, weil sie amüsant sind).
Eines meiner häufigsten Lieblingsbeispiele ist das Geburtstagsparadox ( Wikipedia-Eintrag ), das einige wichtige Konzepte der Wahrscheinlichkeit veranschaulicht. Sie können dies mit einem Raum voller Menschen simulieren.
Im Übrigen empfehle ich Andrew Gelmans "Teaching Statistics: A Bag of Tricks", um einige Beispiele für kreative Methoden zum Unterrichten statistischer Konzepte zu finden (siehe Inhaltsverzeichnis ). Schauen Sie sich auch seinen Aufsatz über den Kurs an, den er zum Unterrichten von Statistik unterrichtet: "Ein Kurs zum Unterrichten von Statistik auf Universitätsniveau" . Und zu "Bayes für Doktoranden der Politikwissenschaft, Soziologie, Volksgesundheit, Bildung, Wirtschaft, ..." .
Um Bayes'sche Methoden zu beschreiben, ist die Verwendung einer unfairen Münze und das mehrmalige Umwerfen ein ziemlich allgemeiner / effektiver Ansatz.
quelle
Ich möchte die Variation der Stichproben und im Wesentlichen den zentralen Grenzwertsatz anhand einer "in-class" -Übung demonstrieren. Jeder in der Klasse von etwa 100 Schülern schreibt sein Alter auf ein Blatt Papier. Alle Papierstücke haben dasselbe Format und werden nach Berechnung des Durchschnitts auf dieselbe Weise gefaltet. Dies ist die Bevölkerung und ich berechne das Durchschnittsalter. Dann wählt jeder Schüler nach dem Zufallsprinzip 10 Blätter Papier aus, schreibt das Alter auf und legt sie in die Tasche zurück. (S) er berechnet den Mittelwert und gibt den Beutel an den nächsten Schüler weiter. Schließlich haben wir 100 Stichproben von je 10 Schülern, die den Bevölkerungsdurchschnitt schätzen, den wir durch ein Histogramm und einige deskriptive Statistiken beschreiben können.
Wir wiederholen die Demonstration dieses Mal mit 100 "Meinungen", die einige Ja / Nein-Fragen aus jüngsten Umfragen wiederholen. Wenn die (britischen General-) Wahlen morgen stattfinden würden, würden Sie in Betracht ziehen, für die britische Nationale Partei zu stimmen. Die Schüler probieren 10 dieser Meinungen aus.
Am Ende haben wir die Variation der Stichproben, den zentralen Grenzwertsatz usw. sowohl mit kontinuierlichen als auch mit binären Daten demonstriert.
quelle
Auf jeden Fall das Monty Hall Problem. http://en.wikipedia.org/wiki/Monty_Hall_problem
quelle
1) Eine gute Demonstration, wie "zufällig" definiert werden muss, um die Wahrscheinlichkeit bestimmter Ereignisse zu ermitteln:
Wie groß ist die Wahrscheinlichkeit, dass eine zufällige Linie, die über einen Kreis gezogen wird, länger als der Radius ist?
Die Frage hängt ganz davon ab, wie Sie Ihre Linie ziehen. Zu den Möglichkeiten, die Sie für einen am Boden gezeichneten Kreis in der Praxis beschreiben können, gehören:
Zeichnen Sie zwei zufällige Punkte innerhalb des Kreises und ziehen Sie eine Linie durch diese. (Sehen Sie, wo zwei Fliegen / Steine fallen ...)
Wählen Sie einen festen Punkt auf dem Umfang und dann einen zufälligen Punkt an einer anderen Stelle im Kreis und fügen Sie diese zusammen. (Tatsächlich wird ein Stab in einem variablen Winkel durch einen bestimmten Punkt und einen zufälligen Punkt über den Kreis gelegt, z. B. wo ein Stein fällt.)
Zeichnen Sie einen Durchmesser. Wähle zufällig einen Punkt und ziehe eine Senkrechte durch diesen. (Rollen Sie einen Stock in einer geraden Linie, damit er über den Kreis läuft.)
Es ist relativ einfach, jemanden zu zeigen, der Geometrie beherrscht (aber nicht unbedingt Statistiken). Die Antwort auf die Frage kann recht unterschiedlich sein (von ungefähr 2/3 bis ungefähr 0,866 oder so).
3) Erklären, warum die medizinische Diagnose wirklich fehlerhaft zu sein scheint. Ein Test auf Krankheit foo, der zu 99,9% genau ist, um diejenigen zu identifizieren, die sie haben, aber zu 0,1% falsch-positiv diagnostiziert, kann so oft falsch erscheinen, wenn die Prävalenz der Krankheit wirklich niedrig ist ( zB 1 in 1000), aber viele Patienten werden darauf getestet.
Dies lässt sich am besten mit reellen Zahlen erklären - stellen Sie sich vor, 1 Million Menschen werden untersucht, also haben 1000 die Krankheit, 999 werden korrekt identifiziert, aber 0,1% von 999.000 sind 999, denen mitgeteilt wird, dass sie sie haben, aber nicht. Die Hälfte derjenigen, denen gesagt wird, sie hätten es tatsächlich nicht, trotz der hohen Genauigkeit (99,9%) und der geringen Anzahl falsch positiver Ergebnisse (0,1%). Ein zweiter (idealerweise anderer) Test trennt diese Gruppen dann voneinander.
[Im Übrigen habe ich die Zahlen ausgewählt, weil sie leicht zu verarbeiten sind. Natürlich müssen sie nicht zu 100% addiert werden, da die Genauigkeit / Falsch-Positiv-Raten unabhängige Faktoren im Test sind.]
quelle
Sam Savages Buch Flaw of Averages enthält viele gute Erklärungen statistischer Konzepte für Laien. Insbesondere hat er eine gute Erklärung für Jensens Ungleichung. Wenn der Graph Ihrer Kapitalrendite konvex ist, dh "Sie anlächelt", ist die Zufälligkeit zu Ihren Gunsten: Ihre durchschnittliche Rendite ist höher als Ihre durchschnittliche Rendite.
quelle
In Anlehnung an den Mittelwert als Gleichgewichtspunkt gefällt mir diese Ansicht des Medians als Gleichgewichtspunkt:
quelle
Behar et al haben eine Sammlung von 25 Analogien für den Statistikunterricht. Hier sind zwei Beispiele:
Andere Beispiele schließen ein
Verweise
quelle
Lustige Frage.
Jemand fand heraus, dass ich in der Biostatistik arbeite, und sie fragten mich (im Grunde genommen): "Ist Statistik nicht nur eine Art zu lügen?"
(Womit das Zitat von Mark Twain über Lies, Damn Lies und Statistics zurückkommt.)
Ich habe versucht zu erklären, dass die Statistik es uns erlaubt, mit hundertprozentiger Genauigkeit zu sagen, dass unter den gegebenen Annahmen und gegebenen Daten die Wahrscheinlichkeit für so und so genau so und so war.
Sie war nicht beeindruckt.
quelle