Wie nähert sich Pearsons Chi-Quadrat-Statistik einer Chi-Quadrat-Verteilung an?

10

Wenn also Pearsons Chi-Quadrat-Statistik für eine Tabelle angegeben wird, lautet ihre Form:1×N

i=1n(OiEi)2Ei

Dann entspricht dies ungefähr , der Chi-Quadrat-Verteilung mit n - 1 Freiheitsgraden, wenn die Stichprobengröße N größer wird. χn12n1N

Was ich nicht verstehe, ist, wie diese asymptotische Annäherung funktioniert. Ich denke, das in den Nennern sollte durch s 2 i ersetzt werdenEi . Da dies zuχ 2 n = n i = 1 Z 2 i fürZin(0,1) führen würde. Aber das hat natürlichnFreiheitsgrade, nichtn-1, also ist eindeutig etwas anderes los.si2niχn2=i=1nZi2Zin(0,1)nn1

Thoth
quelle
Obwohl dies Ihre Frage nicht beantwortet , kann es etwas Licht ins Dunkel bringen.
whuber

Antworten:

11

Ich werde dies intuitiv motivieren und angeben, wie es für den Sonderfall zweier Gruppen zustande kommt, vorausgesetzt, Sie akzeptieren gerne die normale Annäherung an das Binomial.

Hoffentlich reicht das aus, um ein gutes Gefühl dafür zu bekommen, warum es so funktioniert, wie es funktioniert.

Sie sprechen von der Chi-Quadrat-Güte des Fit-Tests. Nehmen wir an, es gibt Gruppen (Sie haben es als n , aber es gibt einen Grund, warum ich es lieber k nenne ).knk

In dem Modell, das für diese Situation angewendet wird, sind die Zählungen , i = 1 , 2 , . . . , k sind multinomial .Oii=1,2,...,k

Sei . Die Zählungen sind von der Summe N abhängig (außer in einigen ziemlich seltenen Situationen); und es gibt einige vorgegebene Mengen von Wahrscheinlichkeiten für jede Kategorie, p i , i = 1 , 2 , , k , die sich zu 1 summieren .N=i=1kOiNpi,i=1,2,,k1

Genau wie beim Binomial gibt es eine asymptotische Normalnäherung für Multinomialwerte. Wenn Sie nur die Anzahl in einer bestimmten Zelle berücksichtigen ("in dieser Kategorie" oder nicht), ist dies ein Binomialwert. Genau wie beim Binom sind die Varianzen der Zählungen (sowie ihre Kovarianzen im Multinom) Funktionen von und den p ; Sie schätzen eine Varianz nicht separat.Np

Ei=NpiNk1k1Npi(1pi)Npipjk1

Var(Oi)=Npi(1pi)zi=OiEiEi(1pi)ziχk2k1kχk12k1

p1=pp2=1pX=O1NX=O2

XN(Np,Np(1p))z=XNpNp(1p)z2=(XNp)2Np(1p)χ12χ12

Beachte das

i=12(OiEi)2Ei=[XNp]2Np+[(NX)(NNp)]2N(1p)=[XNp]2Np+[XNp]2N(1p)=(XNp)2[1Np+1N(1p)]

Aber

1Np+1N(1p)=Np+N(1p)Np.N(1p)=1Np(1p)

i=12(OiEi)2Ei=(XNp)2Np(1p)z2χ12EiEi(1pi)

(OiEi)2Ei(OiEi)2Ei(1pi)kk1

χk12k

Glen_b - Monica neu starten
quelle
Danke, das macht Sinn. Ist das so etwas wie ein mathematischer Zufall / Unfall, dass es so gut funktioniert, nur durch den erwarteten Wert zu dividieren? oder gibt es eine intuitive statistische Erklärung, warum dies der Fall sein sollte?
Thoth
zEi
Eik1
0

T2k1k1

Dohmatob
quelle