Nach einer kürzlichen Abstimmung habe ich versucht, mein Verständnis des Pearson Chi Squared-Tests zu überprüfen. Normalerweise verwende ich die Chi-Quadrat-Statistik (oder die reduzierte Chi-Quadrat-Statistik) zum Anpassen oder Überprüfen der resultierenden Passform. In diesem Fall entspricht die Varianz normalerweise nicht der erwarteten Anzahl von Zählungen in einer Tabelle oder einem Histogramm, sondern einer experimentell bestimmten Varianz. So oder so hatte ich immer den Eindruck, dass der Test immer noch die asymptotische Normalität des multinomialen PDFs verwendete (dh meine Teststatistik ist
und ist asymptotisch multinormal, wobei eine Kovarianzmatrix ist. Daher hat eine Chi-Quadrat-Verteilung mit einem großen sodass die Verwendung der erwarteten Anzahl von Zählungen als Nenner in der Statistik für ein großes gültig wird . Es ist möglich, dass dies nur für Histogramme zutrifft. Ich habe seit Jahren keine kleine Datentabelle mehr analysiert.
Gibt es ein subtileres Argument, das mir fehlt? Mich würde eine Referenz interessieren, oder noch besser eine kurze Erklärung. (Obwohl es möglich ist, wurde ich gerade dafür gestimmt, das Wort asymptotisch wegzulassen, was meiner Meinung nach ziemlich wichtig ist.)
quelle
Antworten:
Ein Chi-Quadrat-Test dient zur Analyse kategorialer Daten. Das bedeutet, dass die Daten gezählt und in Kategorien unterteilt wurden. Es funktioniert nicht mit parametrischen oder kontinuierlichen Daten. Es funktioniert also nicht in jedem Fall, die resultierende Passform zu bestimmen.
Quelle: http://www.ling.upenn.edu/~clight/chisquared.htm
quelle