Mein Vater ist Mathematikbegeisterter, interessiert sich aber nicht besonders für Statistik. Es wäre ordentlich zu versuchen , einige der wunderbaren Teile der Statistik zu veranschaulichen, und das CLT ist ein erstklassiger Kandidat. Wie würden Sie die mathematische Schönheit und Wirkung des zentralen Grenzwertsatzes einem Nicht-Statistiker vermitteln?
33
Antworten:
Was ich am meisten an CLT geliebt habe, sind Fälle, in denen es nicht anwendbar ist - dies gibt mir die Hoffnung, dass das Leben ein bisschen interessanter ist, als es die Gauß-Kurve nahelegt. Zeigen Sie ihm also die Cauchy-Verteilung.
quelle
Um den CLT voll zu würdigen, sollte er gesehen werden.
Daher der Begriff der Bohnenmaschine und viele Youtube- Videos zur Veranschaulichung.
quelle
Wenn Mathematiker über Wahrscheinlichkeit sprechen, beginnen sie oft mit einer bekannten Wahrscheinlichkeitsverteilung und sprechen dann über die Wahrscheinlichkeit von Ereignissen. Der wahre Wert des zentralen Grenzwertsatzes ist, dass wir in Fällen, in denen wir die wahre Verteilung nicht kennen, die Normalverteilung als Näherung verwenden können. Sie könnten Ihrem Vater eine Frage zur Standardstatistik stellen (aber als mathematisch formuliert), wie hoch die Wahrscheinlichkeit ist, dass der Mittelwert einer Stichprobe größer als ein bestimmter Wert ist, wenn die Daten aus einer Verteilung mit dem Mittelwert mu und sd sigma stammen Er geht von einer Verteilung aus (von der Sie dann sagen, dass wir sie nicht kennen) oder sagt, dass er die Verteilung kennen muss. Dann können Sie zeigen, dass wir die Antwort in vielen Fällen mit dem CLT approximieren können.
Um Mathematik mit Statistiken zu vergleichen, verwende ich gerne den Mittelwertsatz der Integration (der besagt, dass für ein Integral von a nach b ein Rechteck von a nach b mit der gleichen Fläche existiert und die Höhe des Rechtecks der Durchschnitt von ist) Kurve). Der Mathematiker betrachtet diesen Satz und sagt: "Cool, ich kann eine Integration verwenden, um einen Durchschnitt zu berechnen", während der Statistiker denselben Satz betrachtet und sagt: "Cool, ich kann einen Durchschnitt verwenden, um ein Integral zu berechnen".
Tatsächlich habe ich in meinem Büro Kreuzstich-Wandbehänge mit dem Mittelwertsatz und dem CLT (zusammen mit dem Bayes-Satz).
quelle
Ich möchte die Variation der Stichproben und im Wesentlichen den zentralen Grenzwertsatz anhand einer "in-class" -Übung demonstrieren. Jeder in der Klasse von etwa 100 Schülern schreibt sein Alter auf ein Blatt Papier. Alle Papierstücke haben dasselbe Format und werden nach Berechnung des Durchschnitts auf dieselbe Weise gefaltet. Dies ist die Bevölkerung und ich berechne das Durchschnittsalter. Dann wählt jeder Schüler nach dem Zufallsprinzip 10 Blätter Papier aus, schreibt das Alter auf und legt sie in die Tasche zurück. (S) er berechnet den Mittelwert und gibt den Beutel an den nächsten Schüler weiter. Schließlich haben wir 100 Stichproben von je 10 Schülern, die den Bevölkerungsdurchschnitt schätzen, den wir durch ein Histogramm und einige beschreibende Statistiken beschreiben können.
Wir wiederholen die Demonstration dieses Mal mit 100 "Meinungen", die einige Ja / Nein-Fragen aus jüngsten Umfragen wiederholen. Wenn die (britischen General-) Wahlen morgen stattfinden würden, würden Sie in Betracht ziehen, für die britische Nationale Partei zu stimmen. Die Schüler probieren 10 dieser Meinungen aus.
Am Ende haben wir die Variation der Stichproben, den zentralen Grenzwertsatz usw. sowohl mit kontinuierlichen als auch mit binären Daten gezeigt.
quelle
Das Herumspielen mit dem folgenden Code, das Variieren des Werts
M
und das Auswählen von anderen Verteilungen als der Uniform kann eine lustige Illustration sein.quelle
Wenn Sie Stata verwenden, können Sie den Befehl -clt- verwenden, mit dem Diagramme von Stichprobenverteilungen erstellt werden
http://www.ats.ucla.edu/stat/stata/ado/teach/clt.htm
quelle
Nach meiner Erfahrung ist das CLT weniger nützlich als es scheint. Man weiß in der Mitte eines Projekts nie, ob n groß genug ist, um die Näherung an die Aufgabe anzupassen. Und für statistische Tests hilft Ihnen das CLT, den Fehler vom Typ I zu schützen, trägt jedoch wenig dazu bei, den Fehler vom Typ II in Schach zu halten. Beispielsweise kann der t-Test für große n eine beliebig niedrige Leistung haben, wenn die Datenverteilung extrem verzerrt ist.
quelle