Einfacher Beweis von ?

10

Sei unabhängige normale Standard-Zufallsvariablen. Es gibt viele (langwierige) Beweise, die das zeigenZ1,,Zn

i=1n(Zi1nj=1nZj)2χn12

Viele Beweise sind ziemlich lang und einige verwenden Induktion (z. B. Casella Statistical Inference). Ich frage mich, ob es einen einfachen Beweis für dieses Ergebnis gibt.

3x89g2
quelle
Für einen intuitiven geometrischen (koordinatenfreien) Ansatz siehe Abschnitt 1.2 des hervorragenden Textes Der koordinatenfreie Ansatz für lineare Modelle von Michael J. Wichura (die technischen Details sind in Satz 8.2 aufgeführt), in dem der Autor den traditionellen Ansatz tatsächlich verglichen hat Matrixbeweis (bereitgestellt durch Whubers Antwort) und sein Projektionsansatz zeigen, dass sein geometrischer Ansatz natürlicher und weniger dunkel ist. Persönlich halte ich diesen Beweis für aufschlussreich und prägnant.
Zhanxiong

Antworten:

10

Für , definierenk=1,2,,n1

Xk=(Z1+Z2++ZkkZk+1)/k+k2.

Das , das lineare Transformationen von multinormal verteilten Zufallsvariablen , hat auch eine multinormale Verteilung. Beachten Sie, dassZ iXkZi

  1. Die Varianz-Kovarianz-Matrix von ist die Identitätsmatrix.n - 1 × n - 1(X1,X2,,Xn1)n1×n1

  2. X12+X22++Xn12=i=1n(ZiZ¯)2.

( 2 ) X k ˉ Z . 1 + 1 + + 1 - k = 0 k(1) , was leicht zu überprüfen ist, impliziert direkt , dass alle bei Beobachtung nicht mit sind Die Berechnungen alle auf der Tatsache, dass , wobei es gibt .(2)XkZ¯.1+1++1k=0k

Zusammen zeigen diese, dass die Verteilung der Summe von unkorrelierten Einheitsvarianz- hat . Per Definition ist dies die -Verteilung QED . n - 1 χ 2 ( n - 1 )i=1n(ZiZ¯)2n1χ2(n1)

Verweise

  1. Eine Erklärung, woher die Konstruktion von stammt, finden Sie am Anfang meiner Antwort unter Wie man eine isometrische Log-Ratio-Transformation für Helmert-Matrizen durchführt .Xk

  2. Dies ist eine Vereinfachung der allgemeinen Demonstration in der Antwort von ocram unter Warum RSS Chi-Quadrat-Zeiten np verteilt ist . Diese Antwort , dass "es eine Matrix gibt", um das zu konstruieren ; hier zeige ich eine solche Matrix.Xk

whuber
quelle
Diese Konstruktion hat eine einfache geometrische Interpretation. (1) Die Variablen sind auf einer n-dimensionalen sphärisch symmetrischen Verteilung verteilt (somit können wir sie beliebig drehen). (2) Die wird als Lösung für das lineare Problem , das effektiv eine Projektion des Vektors auf . (3) Wenn wir den Koordinatenraum so drehen, dass eine der Koordinaten mit diesem Projektionsvektor übereinstimmt , ist der Rest eine (n-1) -Multinomverteilung, die den Restraum darstellt. ¯ Z Z i = ¯ Z + ϵ i Z 1 1ZiZ¯Zi=Z¯+ϵiZ11
Sextus Empiricus
Sie zeigen, dass die nicht miteinander korreliert sind. Aber soweit ich verstehe, brauchen wir Unabhängigkeit, um zu sagen, dass eine Summe der quadratischen Standardnormalvariablen ist, was eine viel stärkere Anforderung ist als unkorreliert? EDIT: Oh, warte, wenn wir wissen, dass zwei Variablen normal verteilt sind, dann impliziert unkorreliert Unabhängigkeit. χ 2Xiχ2
user56834
Ich verstehe auch nicht, wie Sie von der Tatsache, dass die mit (was ich verstehe) sind , zu (2) übergehen. Könnten Sie näher darauf eingehen? ˉ Z.XiZ¯
user56834
@Programmer Sorry; Ich wollte nicht implizieren, dass es eine logische Folgerung ist - (1) und (2) sind zwei getrennte Beobachtungen. (2) ist lediglich eine (einfache) algebraische Identität.
whuber
1
Programmierer, beachten Sie den Link zu der anderen Antwort, die Whuber gegeben hat ( stats.stackexchange.com/questions/259208/… ). Die basieren auf einer Matrix mit orthogonalen Zeilen. Sie können also abstrakter (weniger fehlbar) als bewerten. , (beachten Sie, dass wir K um den Vektor 1111 erweitern müssen, um es n um n zu machen)XkHKi2KK=(HZ)(HZ)=(HZ)T(HZ)=ZT(HTH)Z=ZTIZ=ZZ
Sextus Empiricus
5

Beachten Sie, dass Sie sagen, sind iid mit Standardnormal , mit undZisN(0,1)μ=0σ=1

Dann istZi2χ(1)2

Dann

i=1nZi2=i=1n(ZiZ¯+Z¯)2=i=1n(ZiZ¯)2+nZ¯2(1)=i=1n(ZiZ¯)2+[n(Z¯0)1]2

Beachten Sie, dass die linke Seite von (1) und der zweite Term auf der rechten Seite

i=1nZi2χ(n)2
[n(Z¯0)1]2χ(1)2.

Außerdem ist so dass und unabhängig sind. Daher sind auch die beiden letzten Terme in (1) (Funktionen von und ) unabhängig. Ihre mgfs beziehen sich daher auf die mgf der linken Seite von (1) durch wobei und . Die mgf von ist daher . Somit ist ein Chi-Quadrat mit Freiheitsgraden.Cov(ZiZ¯,Z¯)=0ZiZ¯Z¯ZiZ¯Zi

Mn(t)=Mn1(t)M1(t)
Mn(t)=(12t)n/2M1(t)=(12t)1/2i=1n(ZiZ¯)2 n i = 1 (Zi-Z )2n-1Mn1(t)=Mn(t)/M1(t)=(12t)(n1)/2i=1n(ZiZ¯)2n1
Tiefer Norden
quelle
1
Das letzte "Deshalb" ist zu nachlässig
Zhanxiong
Die unabhängige Standard-Deivation ist abhängig vonX¯
Deep North
2
"Standardabweichung unabhängig von "? Vielleicht wollten Sie sagen, dass unabhängig von . Dies ist leider nicht wahr. Was wirklich gilt, ist ist unabhängig von , was auch ein Teil des Beweises ist, den wir vervollständigen müssen (anstatt ihn zu verwenden, wenn wir diesen Satz zeigen). Z 2 i ˉ Z(Zi- ˉ Z )2 ˉ Z.X¯Zi2Z¯(ZiZ¯)2Z¯
Zhanxiong
Ich glaube, ich habe Cochrans Theorem
Deep North
3
@DeepNorth Wenn Sie einige fehlende Teile in Ihrem Proof
ausfüllen