Wie ist die Verteilung für verschiedene Freiheitsgrade bei 0 definiert?

7

Ich versuche die -Verteilung zu verstehen . Wikipedia hat das folgende Diagramm für die Wahrscheinlichkeitsdichtefunktion:χ2

Geben Sie hier die Bildbeschreibung ein

Diese Grafik zeigt, dass für das PDF ... unendlich ist? Der Modus der -Verteilung ist definiert als , alsok=1χ2max{k2,0}f1(0)=?

In anderen Grafiken im Web schien es sogar höher als . Wie hier:1

Geben Sie hier die Bildbeschreibung ein

Natürlich nähert sich die kumulative Verteilungsfunktion für alle Freiheitsgrade:1

Geben Sie hier die Bildbeschreibung ein

Ich verstehe nicht, warum sich die Wahrscheinlichkeitsverteilungsfunktion für jedes um so verhält . Wie ist die -Verteilung um definiert ?0kχ20

CamilB
quelle
2
Haben Sie sich die Formel für ihre Dichte angesehen? Das beantwortet Ihre Frage sofort und vollständig.
whuber
Ich habe das Gefühl, dass Sie wirklich fragen, ob es sinnvoll ist, die CDF auf 1 zu beschränken, wenn die PDF-Datei bei Null auf unendlich geht. Ist es das?
Antoni Parellada
@AntoniParellada: Was ich frage, ist eher wie: Wie wird es in Einklang gebracht, dass das PDF für so hoch ist, wenn es sich 0 nähert, mit der Tatsache, dass CDF auf begrenzt ist (und sein muss) . Es scheint, dass die Integration des PDF etwas mehr als . k=111
CamilB
3
Es hört sich so an, als müssten Sie stats.stackexchange.com/questions/4220/… lesen .
whuber
2
Ihr Gefühl, dass der Bereich unter dem PDF aufgrund der Art und Weise, wie er sich dem Ursprung nähert, größer als 1 ist, ist nicht ungewöhnlich (wenn man ein Diagramm der Dichte für sagt), aber es ist ein falscher Eindruck. Beachten Sie, dass die Dichte als sehr nahe an (während sie für die richtige Auswahl von immer darunter liegt ). Die meisten Leute würden jedoch die Umkehrung dieser Obergrenze betrachten (Plot gegen für sagen) - ohne sich Sorgen darüber zu machen, dass sie im Gebiet explodiert (und das aus gutem Grund - - tut es nicht). Wahrnehmungen können durch einen einfachen 0<x<0.1x0cxcc2y2yy>1.2
Achsenwechsel getäuscht werden

Antworten:

7

Das PDF einer Verteilung ist χ2f(x;k)=12k2Γ(k/2)xk/21exp(x/2).

Wir müssen also nur den Ausdruck für auswerten .f(0;k)

f(0;1)=
f(0;2)=0.5
f(0;3)=0
und so weiter. Der R-Code hierfür ist dchisq(0,k)für einige positive k. Es ist wirklich nur für interessant, weil für und 0 für unendlich ist .k=2f(0;k)0<k<2k>2
Sycorax sagt Reinstate Monica
quelle
Vielen Dank, dass Sie R vorgeschlagen haben. Ich werde versuchen, die Funktion zu zeichnen, um ein besseres Gefühl zu erhalten.
CamilB
3
Man könnte argumentieren, dass es bei für keinen anderen df-Wert als 2 besonders interessant ist , da es immer entweder als (für ) oder als (für ) ins Unendliche geht . x=0x0k<20k>2
Glen_b -Reinstate Monica
@Glen_b Das ist eigentlich ein wirklich guter Punkt: Der einzig interessante Wert von ist genau . f(0;k)2
Sycorax sagt Reinstate Monica
0

Versuchen wir, zur Definition dieser Verteilung zurückzukehren und zu sehen, was um 0 herum passiert.

Per Definition ist die Verteilung die der Summe der Quadrate unabhängiger normaler Zufallsvariablen: (siehe Wikipedia-Seite ). Wir sehen leicht, dass der Wert der Dichte für und für . Für ist der Fall etwas anders.χ2

Y=i=1kZi2,
0k3.5k=2k=1

Betrachten wir genau diesen Fall, um Ihre Frage zu lösen: Durch eine Änderung der Variablen haben wir so dass:y=g(z)=z2

fY(y)=|ddy(g1(y))|fZ(g1(y))=|ddy(y)|fZ(y)=12y12πexp(y/2)

Wir verstehen eine grundlegende Tatsache, dass nicht bei definiert ist, da die Quadrierungsoperation an diesem Punkt flach ist. und somit nicht definiert ist (unendlich).χ10g(0)=0g1(0)

meduz
quelle
Wie die Mathematik zeigt, folgt die Tatsache, dass die Dichte bei undefiniert ist, aus zwei Tatsachen. Es reicht nicht aus, dass . Außerdem benötigen Sie . 0g(0)=0fZ(0)0
whuber