Woher kommt die Gaußsche Funktion?

9

Ich habe unzählige Seiten auf Google gelesen und kann keine zufriedenstellende Antwort finden. Ich habe auch http://castatistics.wikispaces.com/file/view/normal+der..pdf gelesen , aber ich bezweifle, dass dies die ursprüngliche Motivation für die Gaußsche Funktion war. Ich bin zurzeit ein Student und mein Lehrbuch sagt mir nur, dass die Funktion f (x) = ae - (x - b) ^ 2 / c als Wahrscheinlichkeitsdichtefunktion für eine normale Kurve verwendet wird. Mein Lehrbuch gibt mir jedoch keine Hinweise darauf, woher diese Funktion tatsächlich stammt. Was war die ursprüngliche Motivation für die Entwicklung einer solchen Funktion? Kann jemand bitte einen Beweis dafür erbringen, dass ich mit klar gekennzeichneten Schritten tatsächlich unterschätzen kann? Ich verstehe die Grundrechnung und bin ein Anfänger, wenn es um Statistik geht. Bitte keine komplizierten Beweise.

Andrew Kudwitt
quelle
2
Als Antwort auf eine sehr ähnliche Frage habe ich stats.stackexchange.com/a/3904 angeboten , was Sie vielleicht nützlich finden. Genau genommen beantwortet es Ihre Frage nach "Motivation" nicht: Das kam mehrere Generationen nach de Moivre, als Gauß die Methode der kleinsten Quadrate entwickelte.
whuber

Antworten:

4

Die Normalverteilung ist die Verteilung, die erwartet wird, wenn Messungen aus einer großen Anzahl von "Rausch" -Komponenten durchgeführt werden, die alle auf die gleiche Weise verteilt sind.

Das Prinzip wird manchmal anhand eines Beispiels mit Würfeln veranschaulicht. Wirf einen Würfel oft und zeichne die Verteilung der Werte. Angenommen, der Würfel ist fair, erhalten Sie eine (diskrete) gleichmäßige Verteilung von 1 bis 6. Machen Sie das jetzt noch einmal, aber verwenden Sie zwei Würfel. Sie erhalten eine schrittweise dreieckige Verteilung von 2 bis 12. Fügen Sie einen dritten Würfel hinzu, und die Verteilung ist etwas glockenförmig, und die Stufen sind klein, da jetzt 17 verschiedene mögliche Werte vorhanden sind. Bei vier Würfeln ähnelt die Verteilung einer Normalverteilung, und bei einer unendlichen Anzahl von Würfeln handelt es sich um eine Normalverteilung. Für eine Verteilung, die aus praktischen Gründen nicht von der durch die Normalformel gegebenen Normalverteilung nicht zu unterscheiden ist, werden zwischen vier und unendlich viele Würfel benötigt (ich sage oft 12).

Viele biologische und physikalische Messungen haben viele Ursachen für Ungenauigkeiten und Rauschen. Daher sind die Verteilungen dieser Messungen ungefähr normal, solange die Verteilungen dieser Komponenten ähnlich sind. Wenn eine Rauschkomponente viel größer als die anderen ist, ergibt sich keine Normalverteilung. Stellen Sie sich vor, ein Würfel aus einem Dutzend würde Gesichter haben, die von 100 bis 600 anstatt von 1 bis 6 markiert sind. Dieser Würfel würde die anderen elf dominieren, und die Verteilung der Summe ihrer oberen Gesichter wäre eine offensichtliche Mischung aus (diskret) einheitlich 100 bis 600 und nahezu kontinuierlich nahezu normal 11 bis 66. Die Verteilungen der Komponentenvariationen müssen ähnlich sein, auch wenn sie nicht normal sein müssen (sie müssen nicht einmal nahezu normal sein, wenn es a gibt Viele von ihnen).

(Es ist erwähnenswert, dass viele Variabilitätsquellen eine logarithmische Verteilung aufweisen und so viele Messungen in Biologie und Physik nahezu logarithmisch normal als normal sind.)

Michael Lew
quelle