Ich habe kürzlich festgestellt, dass es notwendig ist, ein PDF für das Quadrat einer normalen Zufallsvariablen mit Mittelwert 0 abzuleiten. Aus irgendeinem Grund habe ich mich dafür entschieden, die Varianz vorher nicht zu normalisieren. Wenn ich das richtig gemacht habe, ist dieses PDF wie folgt:
Mir ist aufgefallen, dass dies eigentlich nur eine Parametrisierung einer Gammaverteilung ist:
Und aus der Tatsache, dass die Summe von zwei Gammas (mit demselben Skalenparameter) einem anderen Gamma entspricht, folgt, dass das Gamma der Summe der normalen Zufallsvariablen im Quadrat entspricht .
Das war ein bisschen überraschend für mich. Auch wenn ich das weiß Verteilung - eine Verteilung der Summe der quadrierten Standard normaler RVs - war ein Sonderfall des Gamma, habe ich nicht die Gamma erkennen war im Wesentlichen nur eine Verallgemeinerung für die Summe der normalen erlaubt Zufallsvariablen beliebiger Varianz. Dies führt auch zu anderen Charakterisierungen, auf die ich vorher noch nicht gestoßen bin, wie zum Beispiel, dass die Exponentialverteilung der Summe von zwei quadratischen Normalverteilungen entspricht.
Das ist mir alles etwas rätselhaft. Ist die Normalverteilung grundlegend für die Ableitung der Gammaverteilung in der oben beschriebenen Weise? Die meisten Ressourcen, die ich überprüft habe, erwähnen nicht, dass die beiden Verteilungen inhärent miteinander verwandt sind, oder beschreiben sogar, wie das Gamma abgeleitet wird. Das lässt mich denken, dass eine Wahrheit auf niedrigerer Ebene vorliegt, die ich einfach auf verschlungene Weise hervorgehoben habe?
Antworten:
Wie Prof. Sarwates Kommentar feststellte, sind die Beziehungen zwischen Quadratnormalen und Chi-Quadrat eine sehr weit verbreitete Tatsache - ebenso wie die Tatsache, dass ein Chi-Quadrat nur ein Sonderfall der Gamma-Verteilung ist:
Die letzte Gleichheit ergibt sich aus der Skalierungseigenschaft des Gamma.
Was die Beziehung zum Exponential betrifft, so führt genau genommen die Summe von zwei quadratischen Normalen mit dem Mittelwert Null, die jeweils durch die Varianz des anderen skaliert werden , zur Exponentialverteilung:
Der Verdacht, dass es in der Summe zweier quadratischer Null-Mittel-Normalen "etwas Besonderes" oder "Tieferes" gibt , das "sie zu einem guten Modell für die Wartezeit macht", ist jedoch unbegründet: Was ist das Besondere an der exponentiellen Verteilung, die sie ausmacht? ist es ein gutes Modell für "Wartezeit"? Memorylessness natürlich, aber gibt es hier etwas "Tieferes" oder nur die einfache Funktionsform der Exponentialverteilungsfunktion und die Eigenschaften von ? Einzigartige Eigenschaften sind in der gesamten Mathematik verstreut und spiegeln meistens keine "tiefere Intuition" oder "Struktur" wider - sie existieren nur (zum Glück).e
Zweitens hat das Quadrat einer Variablen nur eine sehr geringe Beziehung zu ihrer Ebene. Betrachten Sie einfach in, sagen wir, :f(x)=x [−2,2]
... oder die Standardnormaldichte in Abhängigkeit von der Chi-Quadrat-Dichte grafisch darstellen: Sie reflektieren und repräsentieren völlig unterschiedliche stochastische Verhaltensweisen, auch wenn sie so eng miteinander verwandt sind, da die zweite die Dichte einer Variablen ist, die das Quadrat der ersten ist. Das Normale mag eine sehr wichtige Säule des mathematischen Systems sein, das wir zur Modellierung des stochastischen Verhaltens entwickelt haben - aber sobald Sie es quadrieren, wird es zu etwas völlig anderem.
quelle
Lassen Sie uns die gestellte Frage ansprechen: Das ist alles etwas mysteriös für mich. Ist die Normalverteilung grundlegend für die Ableitung der Gammaverteilung ...? Eigentlich kein Rätsel, es ist einfach so, dass die Normalverteilung und die Gammaverteilung Mitglieder ua der exponentiellen Verteilungsfamilie sind, wobei diese Familie durch die Fähigkeit definiert ist, zwischen Gleichungsformen durch Ersetzen von Parametern und / oder Variablen umzurechnen. Als Folge gibt es viele Conversions durch Substitution zwischen Verteilungen, ein paar von denen in der Abbildung unten zusammengefasst.
LEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (Februar 2008). "Univariate Verteilungsbeziehungen" (PDF). Amerikanischer Statistiker. 62 (1): 45–53. doi: 10.1198 / 000313008x270448 cite
Hier sind zwei Normal- und Gammaverteilungsbeziehungen im Detail (unter einer unbekannten Anzahl von anderen, wie z. B. über Chi-Quadrat und Beta).
1. Es folgt eine direktere Beziehung zwischen der Gammaverteilung (GD) und der Normalverteilung (ND) mit dem Mittelwert Null. Einfach ausgedrückt, die Form des GD wird normal, da sich sein Formparameter erhöhen kann. Zu beweisen, dass dies der Fall ist, ist schwieriger. Für die GD gilt
Wenn der GD-Formparameter , wird die GD-Form symmetrischer und normaler. Wenn sich jedoch der Mittelwert mit zunehmendem a erhöht , müssen wir die GD um ( a - 1 ) √ nach links verschiebena→∞ a , um es stationär zu halten, und um schließlich die gleiche Standardabweichung für unser verschobenes GD beizubehalten, müssen wir den Skalenparameter (b) proportional zu√verringern(a−1)1a−−√k b .1a−−√
Um eine GD in einen Grenzfall ND umzuwandeln, setzen wir die Standardabweichung auf eine Konstante ( ), indem wir b = √ lassenk und verschieben Sie den GD nach links, um einen Nullmodus zu erhalten, indem Siez=(a-1)√ einsetzenb=1a−−√k Dann istGD((a-1)√z=(a−1)1a−−√k+x .
2. Lassen Sie uns den Punkt hervorheben, dass man aufgrund der Ähnlichkeit der Form zwischen diesen Verteilungen Beziehungen zwischen der Gamma-Verteilung und der Normalverteilung aufbauen kann, indem man sie aus der Luft zieht. Als nächstes entwickeln wir eine "entfaltete" Gammaverteilungsverallgemeinerung einer Normalverteilung.
Beachten Sie zunächst, dass es die semi-unendliche Unterstützung der Gamma-Verteilung ist, die eine direktere Beziehung zur Normalverteilung verhindert. Dieses Hindernis kann jedoch beseitigt werden, wenn man die Halbnormalverteilung betrachtet, die ebenfalls eine semi-unendliche Unterstützung aufweist. Man kann also die Normalverteilung (ND) verallgemeinern, indem man sie zunächst halbnormal faltet (HND), was die verallgemeinerte Gammaverteilung (GD) betrifft, und dann für unsere Tour de Force beide "entfalten" (HND und GD) also eine verallgemeinerte ND (eine GND) zu machen.
Die verallgemeinerte Gamma-Verteilung
Kann umparametriert werden, um die Halbnormalverteilung zu sein ,
was das impliziert
Das Obige kann als die verallgemeinerte Normalverteilung Version 1 angesehen werden, und in verschiedenen Parametrisierungen ist es als die exponentielle Leistungsverteilung und die verallgemeinerte Fehlerverteilung bekannt, die wiederum eine von mehreren anderen verallgemeinerten Normalverteilungen sind .
quelle
Die Ableitung der Chi-Quadrat-Verteilung von der Normalverteilung ist weitgehend analog zur Ableitung der Gamma-Verteilung von der Exponentialverteilung.
Wir sollten dies verallgemeinern können:
Die Analogie ist wie folgt:
Normal- und Chi-Quadrat-Verteilungen beziehen sich auf die Summe der Quadrate
Exponential- und Gamma-Verteilungen beziehen sich auf die reguläre Summe
Für die Gamma-Verteilung:
WhereV(s)=snn! is the n-dimensional volume of a n-polytope with ∑xi<s .
The gamma distribution can be seen as the waiting timeY for the n -th event in a Poisson process which is the distributed as the sum of n exponentially distributed variables.
As Alecos Papadopoulos already noted there is no deeper connection that makes sums of squared normal variables 'a good model for waiting time'. The gamma distribution is the distribution for a sum of generalized normal distributed variables. That is how the two come together.
But the type of sum and type of variables may be different. While the gamma distribution, when derived from the exponential distribution (p=1), gets the interpretation of the exponential distribution (waiting time), you can not go reverse and go back to a sum of squared Gaussian variables and use that same interpretation.
The density distribution for waiting time which falls of exponentially, and the density distribution for a Gaussian error falls of exponentially (with a square). That is another way to see the two connected.
quelle