Warum ist die Stichprobenverteilung der Varianz eine Chi-Quadrat-Verteilung?

22

Die Aussage

Die Stichprobenverteilung der Stichprobenvarianz ist eine Chi-Quadrat-Verteilung mit einem Freiheitsgrad von , wobei n die Stichprobengröße ist (vorausgesetzt, die interessierende Zufallsvariable ist normalverteilt).n1n

Quelle

Meine Intuition

Es ist für mich intuitiv sinnvoll, 1) weil ein Chi-Quadrat-Test wie eine Summe aus Quadrat und 2) weil eine Chi-Quadrat-Verteilung nur eine Summe aus einer quadratischen Normalverteilung ist. Trotzdem verstehe ich es nicht gut.

Frage

Ist die Aussage wahr? Warum?

Remi.b
quelle
1
Die ursprüngliche Aussage ist im Allgemeinen falsch (sie ist aus zwei verschiedenen Gründen falsch). Was ist Ihre Quelle (Ihr Link fehlt) und was steht eigentlich darin?
Glen_b -Reinstate Monica
Meine Frage kommt auch zur Reaktion auf eine Frage-Antwort in einer Einführungsstatistikklasse, für die der Zugriff geschützt ist. Die Frage lautet: "Wie ist die Stichprobenverteilung der Varianz in der Flügellänge bei Fliegen?" und die Antwort ist "Chi-Quadrat-Verteilung"
Remi.b
1
Die in Ihrem ersten Kommentar angegebene Aussage ist im Allgemeinen immer noch falsch. Der Kommentar am Ende der Quelle wahr ist (mit den notwendigen Annahmen): " wenn die Proben der Größe n von einer Normalverteilung mit einer Varianz genommen , die Stichprobenverteilung der ( n - 1 ) s 2 / σ 2 sind eine Chi-Quadrat-Verteilung mit n-1 Freiheitsgraden.σ2(n1)s2/σ2 "... Die Antwort auf die Frage in Ihrem zweiten Kommentar wird ebenfalls falsch sein - es sei denn, ich nehme an, jemand hat gezeigt, dass die Flügellänge normal verteilt ist. (Welche Grundlage könnte es geben, um zu behaupten, dass dies wahr ist?)
Glen_b
Nehmen wir also an, die Flügel sind normal verteilt, dann wäre die Stichprobenverteilung von im Chi-Quadrat verteilt. Wieso ist es so? (n1)s2/σ2
Remi.b
Ist Ihnen bewusst, dass eine Summe der Quadrate von iid N (0,1) Zufallsvariablen mit k df chi-quadriert ist ? Oder ist das der Teil, für den Sie einen Beweis suchen? kk
Glen_b

Antworten:

27

[Aus der Diskussion in Ihrer Frage gehe ich davon aus, dass Sie gerne annehmen, dass, wenn unabhängig sind, N ( 0 , 1 ) Zufallsvariablen identisch verteilt sind, dann k i = 1 Z 2 i2 k .]Zi,i=1,2,,kN(0,1)i=1kZi2χk2

Formal folgt das Ergebnis, das Sie benötigen, aus dem Satz von Cochran . (Obwohl es auf andere Weise gezeigt werden kann)

Berücksichtigen Sie weniger formal, dass, wenn wir den Populationsmittelwert kennen und die Varianz darüber schätzen (und nicht über den Stichprobenmittelwert): , danns 2 0 /σ2=1s02=1ni=1n(Xiμ)2 (Zi=(Xi-μ)/σ), was1 sein wirds02/σ2=1ni=1n(Xiμσ)2=1ni=1nZi2Zi=(Xiμ)/σ mal eineχ 2 n Zufallsvariable.1nχn2

Die Tatsache , daß die Probe Mittelwert verwendet wird, anstelle der Bevölkerung mean ( ) macht die Summe der Quadrate der Abweichungen kleiner, aber in nur so , daß Σ n i = 1 ( Z i ) 2Zi=(XiX¯)/σ (dazu siehe Satz von Cochran). Daher, anstatt n s 2 0 / σ 2 ~ χ 2 n wir haben jetzt ( n - 1 ) s 2 / σ 2 ~ χ 2 n - 1 .i=1n(Zi)2χn12ns02/σ2χn2(n1)s2/σ2χn12

Glen_b - Setzen Sie Monica wieder ein
quelle
@Glen_b Kannst du einen Hinweis für andere Beweise zu dieser Tatsache geben? Ich möchte es wirklich wissen.
Henry.L
Welche von mehreren Tatsachen haben Sie bewiesen?
Glen_b
@Glen_b Die einzigen zwei Methoden neben dem Cochran-Madow-Theorem, die beweisen, dass die Stichprobenvarianz und der Stichprobenmittelwert statistisch unabhängig mit einer Chi-Quadrat-Verteilung sind: (1) Kanonische Basis von Scheffe (Scheffe, 1959) (2) Kumulantenmethoden (Oder mgfs, was dazu äquivalent ist). Wenn Sie mehr Methoden kennen, möchte ich sie wirklich kennen.
Henry.L
Ein weiterer Kommentar, den ich hinzufügen möchte, ist, dass, obwohl der Mittelwert der Stichprobe verwendet wird, manchmal eine feste Leistung unabhängig von der festen Varianz gewünscht wird, diese Methode durch die zweistufige Methode von Stein (1949) ersetzt wird.
Henry.L
X¯Xis