Welche Bedeutung hat die Funktion

19

In meiner Kalkülklasse sind wir auf die Funktion oder die "Glockenkurve" gestoßen , und mir wurde gesagt, dass sie in der Statistik häufig angewendet wird.e-x2

Aus Neugier möchte ich fragen: Ist die Funktion in der Statistik wirklich wichtig? Wenn ja, warum ist so nützlich, und wie sehen einige seiner Anwendungen aus? e - x 2e-x2e-x2

Ich konnte nicht viele Informationen über die Funktion im Internet finden, aber nach einigen Recherchen fand ich einen Zusammenhang zwischen Glockenkurven im Allgemeinen und etwas, das als Normalverteilung bezeichnet wird . Eine Wikipedia-Seite verknüpft diese Art von Funktionen mit einer Statistikanwendung, wobei ich Folgendes hervorhole:

"Die Normalverteilung wird als die bekannteste Wahrscheinlichkeitsverteilung in der Statistik angesehen. Dafür gibt es mehrere Gründe: 1 Erstens ergibt sich die Normalverteilung aus dem zentralen Grenzwertsatz, der besagt, dass unter milden Bedingungen die Summe einer großen Anzahl von Zufallsvariablen gezogen wird von der gleichen Verteilung wird ungefähr normal verteilt, unabhängig von der Form der ursprünglichen Verteilung . "

Wenn ich also eine große Datenmenge aus einer Art Umfrage oder ähnlichem sammle, könnten sie gleichmäßig auf eine Funktion wie ? Die Funktion ist symmetrisch, also ist ihre Symmetrie, dh ihre Nützlichkeit für die Normalverteilung, was macht sie in der Statistik so nützlich? Ich spekuliere nur.e-x2

Was macht in der Statistik im Allgemeinen nützlich? Wenn Normalverteilung der einzige Bereich ist, was macht einzigartig oder besonders nützlich unter anderen Gaußschen Typfunktionen in der Normalverteilung? e - x 2e-x2e-x2

Zolani13
quelle
Nun, um das zu beginnen, sollte "Mittelwert" nicht "Summe" lauten.
Tristan
2
Die Summe auch. Immerhin ist es nur der Mittelwert multipliziert mit der Anzahl der Stichproben.
Erik
1
Das Zitat zeigt, dass Schlüsselwörter für eine Suche "Normalverteilung" enthalten. Wenn Sie diese Suche hier durchführen , werden mehr als 600 Threads gefunden - durchschnittlich einer pro Tag, seit diese Site gestartet wurde. Ein kurzer Blick auf diese Treffer hilft jedem, die Rolle der "Glockenkurve" in der Statistik schnell zu verstehen.
Whuber
4
Aus dem Thread mit den besten Bewertungen zu Normalverteilungen : "Jeder glaubt an das Exponentialgesetz der Fehler [dh die Normalverteilung]: die Experimentatoren, weil sie glauben, dass dies durch Mathematik bewiesen werden kann, und die Mathematiker, weil sie glauben, dass dies der Fall ist wurde durch Beobachtung festgestellt. "
Whuber
Siehe die Antworten auf meine Frage "Was sind die überraschendsten Merkmale der Gaußschen Verteilung" stats.stackexchange.com/questions/4364/…
Robin Girard

Antworten:

12

Der Grund, warum diese Funktion wichtig ist, ist in der Tat die Normalverteilung und ihr eng verbundener Begleiter, der zentrale Grenzwertsatz (wir haben hier einige gute Erklärungen für die CLT in anderen Fragen ).

In der Statistik kann die CLT normalerweise verwendet werden, um Wahrscheinlichkeiten ungefähr zu berechnen, wobei Aussagen wie "Wir sind zu 95% zuversichtlich, dass ..." möglich sind (die Bedeutung von "95% zuversichtlich" wird oft missverstanden, aber das ist eine andere Sache).

Die Funktion ist (eine skalierte Version von) die Dichtefunktion der Normalverteilung. Wenn eine Zufallsgröße mit der Normalverteilung modelliert werden kann, beschreibt diese Funktion, wie wahrscheinlich unterschiedliche mögliche Werte dieser Größe sind. Ergebnisse in Regionen mit hoher Dichte sind wahrscheinlicher als Ergebnisse in Regionen mit niedriger Dichte.exp(-(x-μ)22σ2)

und σ sind Parameter, die den Ort und den Maßstab der Dichtefunktion bestimmen. Es ist symmetrisch um μ , so ändert μ bedeutetdass Sie die Funktion nach rechts verschieben oder nach links. σ bestimmt den Wert der Dichtefunktion bei ihrem Maximum ( x = μ ) und wie schnell sie auf 0 geht, wenn sich x von μ entfernt . In diesem Sinneändert dasÄndern von σ den Maßstab der Funktion.μσμμσx=μxμσ

Für die spezielle Wahl gilt und σ = 1 / μ=0 Die Dichte ist (proportional zu)e - x 2 . Dies ist keine besonders interessante Auswahl dieser Parameter, hat jedoch den Vorteil, dass eine Dichtefunktion erhalten wird, die etwas einfacher aussieht als alle anderen.σ=1/2e-x2

Andererseits können wir von zu jeder anderen normalen Dichte übergehen, indem wir die Variablen x = u - μ änderne-x2. Der Grund, dass Ihr Lehrbuch sagt, dasse-x2und nichtexp(-(x-μ)2x=u-μ2σe-x2, ist eine sehr wichtige Funktion, dasse-x2einfacher zu schreiben ist.exp(-(x-μ)22σ2)e-x2

MånsT
quelle
1
(+1) Erster Satz des vorletzten Absatzes: Ich könnte sagen, ist proportional zu anstelle von ist .
Kardinal
@ Cardinal: Danke, du hast ganz recht! Ich habe die Antwort bearbeitet.
MånsT
1
12πσ22πσ2
3

exp(-x2)exp(-x2)

Und die Normalverteilung ist vor allem deshalb wichtig, weil sich ("unter milden Gleichmäßigkeitsbedingungen") die Summe vieler unabhängiger und gleichverteilter Zufallsvariablen der Normalverteilung annähert, wenn sich "viele" der Unendlichkeit nähern.

Nicht alles ist normal verteilt. Zum Beispiel sind Ihre Umfrageergebnisse möglicherweise nicht, zumindest wenn die Antworten nicht gleichmäßig verteilt sind, sondern so etwas wie Ganzzahlen 1–5. Der Mittelwert der Ergebnisse wird jedoch normalerweise auf wiederholte Stichproben verteilt, da der Mittelwert nur eine skalierte (normalisierte) Summe ist und die einzelnen Antworten voneinander unabhängig sind. Vorausgesetzt, die Stichprobe ist groß genug, erscheint die Normalität streng genommen erst dann, wenn die Stichprobengröße unendlich wird.

Wie Sie dem Beispiel entnehmen können, kann die Normalverteilung als Ergebnis des Schätzungs- oder Modellierungsprozesses auftreten, auch wenn die Daten nicht normal verteilt sind. Normalverteilungen sind daher in der Statistik allgegenwärtig. In der Bayes'schen Statistik sind viele hintere Verteilungen von Parametern annähernd normal oder können als normal angenommen werden.

Scellus
quelle
e-x2
Sie sind auch nicht, danke für diesen Hinweis. (Meine Absicht war es nicht genau zu sein, nur für einen Nicht-Statistiker verständlich. Es gibt bereits eine gute genaue Antwort.)
scellus
-1

n01/nn

Michael R. Chernick
quelle
Für Kommentare zu dieser Frage wurde unter chat.stackexchange.com/rooms/3720/… ein Chatroom erstellt . Ich habe alle (50!) Kommentare gelöscht und diesen Beitrag gesperrt, um weiteren Missbrauch des Kommentarmechanismus zu verhindern.
Whuber