Wenn also Pearsons Chi-Quadrat-Statistik für eine Tabelle angegeben wird, lautet ihre Form:
Dann entspricht dies ungefähr , der Chi-Quadrat-Verteilung mit n - 1 Freiheitsgraden, wenn die Stichprobengröße N größer wird.
Was ich nicht verstehe, ist, wie diese asymptotische Annäherung funktioniert. Ich denke, das in den Nennern sollte durch s 2 i ersetzt werden . Da dies zuχ 2 n =∑ n i = 1 Z 2 i fürZi∼n(0,1) führen würde. Aber das hat natürlichnFreiheitsgrade, nichtn-1, also ist eindeutig etwas anderes los.
chi-squared
asymptotics
Thoth
quelle
quelle
Antworten:
Ich werde dies intuitiv motivieren und angeben, wie es für den Sonderfall zweier Gruppen zustande kommt, vorausgesetzt, Sie akzeptieren gerne die normale Annäherung an das Binomial.
Hoffentlich reicht das aus, um ein gutes Gefühl dafür zu bekommen, warum es so funktioniert, wie es funktioniert.
Sie sprechen von der Chi-Quadrat-Güte des Fit-Tests. Nehmen wir an, es gibt Gruppen (Sie haben es als n , aber es gibt einen Grund, warum ich es lieber k nenne ).k n k
In dem Modell, das für diese Situation angewendet wird, sind die Zählungen , i = 1 , 2 , . . . , k sind multinomial .Oi i=1,2,...,k
Sei . Die Zählungen sind von der Summe N abhängig (außer in einigen ziemlich seltenen Situationen); und es gibt einige vorgegebene Mengen von Wahrscheinlichkeiten für jede Kategorie, p i , i = 1 , 2 , … , k , die sich zu 1 summieren .N=∑ki=1Oi N pi,i=1,2,…,k 1
Genau wie beim Binomial gibt es eine asymptotische Normalnäherung für Multinomialwerte. Wenn Sie nur die Anzahl in einer bestimmten Zelle berücksichtigen ("in dieser Kategorie" oder nicht), ist dies ein Binomialwert. Genau wie beim Binom sind die Varianzen der Zählungen (sowie ihre Kovarianzen im Multinom) Funktionen von und den p ; Sie schätzen eine Varianz nicht separat.N p
Beachte das
Aber
quelle
quelle