Es sei aus einer Student-t-Verteilung mit Freiheitsgraden für mäßig große (sagen wir weniger als 100) gezogen. Definiere Ist fast wie ein Chi-Quadrat mit Freiheitsgraden verteilt? Gibt es so etwas wie den zentralen Grenzwertsatz für die Summe der quadratischen Zufallsvariablen?
chi-squared
central-limit-theorem
t-distribution
shabbychef
quelle
quelle
Antworten:
Beantwortung der ersten Frage.
Wir könnten von der von mpiktas festgestellten Tatsache ausgehen, dass . Versuchen Sie zunächst einen einfacheren Schritt: Suchen Sie nach der Verteilung einer Summe von zwei durch verteilten Zufallsvariablen . Dies könnte entweder durch Berechnung der Faltung zweier Zufallsvariablen oder durch Berechnung des Produkts ihrer charakteristischen Funktionen geschehen.t2∼F(1,n) F(1,n)
Der Artikel von PCB Phillips zeigt, dass meine erste Vermutung über "[konfluente] hypergeometrische Funktionen" in der Tat richtig war. Dies bedeutet, dass die Lösung nicht trivial ist und die Brute-Force-Methode kompliziert, aber zur Beantwortung Ihrer Frage erforderlich ist. Da also fest ist und Sie t-Verteilungen zusammenfassen, können wir nicht sicher sagen, wie das Endergebnis aussehen wird. Es sei denn, jemand hat gute Kenntnisse im Umgang mit Produkten konfluenter hypergeometrischer Funktionen.n
quelle
Es ist nicht einmal eine enge Annäherung. Für kleines ist die Erwartung von T gleich k nn T während die Erwartung vonχ2(k)gleichk ist. Wennkklein ist (sagen wir weniger als 10), haben die Histogramme vonlog(T)undlog(χ2(k))nicht einmal die gleiche Form, was darauf hinweist, dass das Verschieben und Neuskalieren vonTimmer noch nicht funktioniert.knn−2 χ2(k) k k log(T) log(χ2(k)) T
Intuitiv für kleine Freiheitsgrade Student ist schwer tailed. Das Quadrieren betont diese Schwere. Die Summen , daher werden mehr schief - in der Regel viel mehr schief - als Summe der quadratischen Normalen (die χ 2 Verteilung). Berechnungen und Simulationen belegen dies.t χ2
Illustration (wie gewünscht)
Jedes Histogramm zeigt eine unabhängige Simulation von 100.000 Versuchen mit den angegebenen Freiheitsgraden ( ) und Summanden ( k ), standardisiert wie von @mpiktas beschrieben. Der Wert von n = 9999 in der unteren Reihe entspricht in etwa dem Fall χ 2 . Sie können also T mit χ 2 vergleichen , indem Sie jede Spalte abtasten.n k n=9999 χ2 T χ2
Beachten Sie, dass eine Standardisierung für nicht möglich ist, da die entsprechenden Momente nicht einmal existieren. Der Mangel an Formstabilität (beim Scannen von links nach rechts über eine Zeile oder von oben nach unten über eine Spalte) ist für n ≤ 4 noch deutlicher .n<5 n≤4
quelle
woherEt21 Var(t21) n t21 1 n
quelle