Intuition hinter der t-Verteilungsdichtefunktion

12

Ich studiere die t-Verteilung von Studenten und begann mich zu fragen, wie man die t-Verteilungsdichtefunktion ableiten könnte (aus Wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

Dabei ist der Freiheitsgrad und Γ die Gammafunktion. Was ist die Intuition dieser Funktion? Ich meine, wenn ich mir die Wahrscheinlichkeitsmassenfunktion der Binomialverteilung anschaue, ist das für mich sinnvoll. Aber die t-Verteilungsdichtefunktion macht für mich überhaupt keinen Sinn ... sie ist auf den ersten Blick überhaupt nicht intuitiv. Oder ist die Intuition nur so, dass sie eine glockenförmige Kurve hat und unseren Bedürfnissen dient?vΓ

Danke für jede Hilfe :)

jjepsuomi
quelle
3
Diese Distribution hat eine einfache (und hübsche) geometrische Interpretation. Obwohl Student (1908) diese Form des PDF-Dokuments zuerst durch eine intelligente Vermutung herleitete (unterstützt durch Monte-Carlo-Simulation), erhielt Fisher (um 1920) sie zuerst mit einem geometrischen Argument. Das Wesentliche ist, dass die Verteilung des Verhältnisses der Höhe eines (gleichmäßig verteilten Punktes) auf der ν + 1- Kugel und seines Radius (Abstand von der Achse) beschreibt, dh den Tangens seines Breitengrads. Ein Konto hierfür finden Sie unter evolvedmicrobe.com/Literature/GeometricTDistribution.pdf . fν+1
whuber

Antworten:

8

Wenn Sie eine normale Standardzufallsvariable und eine unabhängige Chi-Quadrat-Zufallsvariable Q mit ν df haben, dannZQν

T=Z/Q/ν

hat eine Verteilung mit ν df. (Ich bin nicht sicher, wie Z / Q verteilt ist, aber es ist nicht t .)tνZ/Qt

Die tatsächliche Ableitung ist ein ziemlich normales Ergebnis. Alecos tut es ein paar Möglichkeiten , hier .

Was die Intuition angeht, habe ich keine besondere Intuition für die spezifische funktionale Form, aber ein allgemeiner Sinn für die Form kann erhalten werden, wenn man bedenkt, dass die (skaliert durch ) Die unabhängige Chi-Verteilung auf dem Nenner ist richtig schief:ν

Bildbeschreibung hier eingeben

Der Modus liegt geringfügig unter 1 (nähert sich jedoch mit zunehmendem df dem Wert 1 an), wobei die Wahrscheinlichkeit besteht, dass die Werte erheblich über und unter 1 liegen bedeutet, dass die Varianz vontgrößer als die vonZ ist. Die Werte vonQ/νtZQ/νtZtZ ist.

tQ/νt

Bildbeschreibung hier eingeben

(Der relativ stärkere Peak führt zu einem etwas schärferen Peak im Verhältnis zum Spread, aber die größere Varianz zieht das Zentrum nach unten, was bedeutet, dass der Peak mit niedrigerem df etwas niedriger ist.)

t

Glen_b - Setzen Sie Monica wieder ein
quelle
1
Ich war etwas schlampig in meiner Erklärung. Natürlich war es die Quadratwurzel der Chi-Quadrat verteilten Zufallsvariablen geteilt durch ihre Freiheitsgrade.
Analyst
@Analyst Ich habe es selbst mehr als einmal gemacht.
Glen_b
8

Die Antwort von Glen ist richtig, aber aus Bayes-Sicht ist es auch hilfreich, sich die t-Verteilung als kontinuierliche Mischung von Normalverteilungen mit unterschiedlichen Varianzen vorzustellen. Die Ableitung finden Sie hier:

Student t als Mischung aus Gauß

Meines Erachtens hilft dieser Ansatz Ihrer Intuition, da er verdeutlicht, wie die t-Verteilung entsteht, wenn Sie die genaue Variabilität Ihrer Population nicht kennen.

Erik
quelle
1
Ich habe hier eine Animation der t-Distribution als Mischung aus normalen Distributionen erstellt: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Bååth