Die Normalverteilung scheint nicht intuitiv zu sein, bis Sie die CLT lernen, was erklärt, warum sie im wirklichen Leben so verbreitet ist. Aber entsteht es jemals als "natürliche" Verteilung für eine bestimmte Menge?
normal-distribution
central-limit-theorem
Gartenkopf
quelle
quelle
Antworten:
Bis zu einem gewissen Grad denke ich, dass dies sowohl ein philosophisches als auch ein statistisches Thema sein kann.
Viele natürlich vorkommende Phänomene sind ungefähr normal verteilt. Man kann argumentieren, ob die zugrunde liegende Ursache dafür so etwas wie das CLT sein kann:
Die Körpergröße von Menschen kann als die Summe vieler kleinerer Ursachen (möglicherweise unabhängig, unwahrscheinlich identisch verteilt) betrachtet werden: Längen verschiedener Knochen oder Ergebnisse verschiedener Genexpressionen oder Ergebnisse vieler diätetischer Einflüsse oder eine Kombination aller oben genannten .
Testergebnisse können als die Summe der Ergebnisse für viele einzelne Testfragen betrachtet werden (möglicherweise identisch verteilt, unwahrscheinlich völlig unabhängig).
Entfernung, die ein Partikel aufgrund der Brownschen Bewegung in einer Flüssigkeit in einer Dimension zurücklegt: Bewegung kann abstrakt als zufälliger Gang betrachtet werden, der aus zufälligen IID-Treffern von Molekülen resultiert.
Ein Beispiel, bei dem die CLT nicht unbedingt beteiligt ist, ist die Streuung der Schüsse um ein Bullauge: Der Abstand vom Bullauge kann als Rayleigh-Verteilung (proportional zur Quadratwurzel von Chi-Quadrat mit 2 DF) und der Winkel gegen den Uhrzeigersinn von modelliert werden Die positive horizontale Achse kann als einheitlich auf modelliert werdenNach dem Wechsel von polaren zu rechteckigen Koordinaten erweisen sich Abstände in horizontaler (x) und vertikaler (y) Richtung als unkorrelierte bivariate Normalen. [Dies ist die Essenz der Box-Muller-Transformation, die Sie googeln können.] Die normalen x- und y-Koordinaten können jedoch als die Summe vieler kleiner Ungenauigkeiten beim Targeting betrachtet werden, die einen CLT-bezogenen Mechanismus im Hintergrund rechtfertigen könnten .(0,2π).
Im historischen Sinne kann die weit verbreitete Verwendung von Normalverteilungen (Gaußschen Verteilungen) anstelle von Doppelexponentialverteilungen (Laplace-Verteilungen) zur Modellierung astronomischer Beobachtungen teilweise auf die CLT zurückzuführen sein. In den frühen Tagen der Modellierung von Fehlern solcher Beobachtungen gab es eine Debatte zwischen Gauß und Laplace , die jeweils für ihre eigene Lieblingsverteilung plädierten. Aus verschiedenen Gründen hat sich das normale Modell durchgesetzt. Man kann argumentieren, dass ein Grund für den möglichen Erfolg der Normalverteilung die mathematische Bequemlichkeit war, die auf normalen Grenzen der CLT beruhte. Dies scheint auch dann der Fall zu sein, wenn unklar ist, welche Verteilungsfamilie die bessere Anpassung bietet. (Selbst jetzt gibt es noch Astronomen, die glauben, dass die "beste Beobachtung"Von einem akribischen, angesehenen Astronomen gemacht, ist sicherlich ein besserer Wert als der Durchschnitt vieler Beobachtungen, die von vermutlich weniger begabten Beobachtern gemacht wurden. Tatsächlich würden sie es vorziehen, wenn Statistiker überhaupt nicht eingreifen würden.)
quelle
Viele natürlich vorkommende Variablen sind normal verteilt. Höhen von Menschen? Größe der Tierkolonien?
quelle
rnorm(1)
. Gleich mit allen Distributionen außer Multinomial.