Verständnis des Chi-Quadrat-Tests und der Chi-Quadrat-Verteilung

13

Ich versuche die Logik hinter dem Chi-Quadrat-Test zu verstehen.

Der Chi-Quadrat-Test ist χ2=(obsexp)2exp . wird dann mit einer Chi-Quadrat-Verteilung verglichen, um einen p-Wert herauszufinden, um die Nullhypothese abzulehnen oder nicht. : Die Beobachtungen stammen aus der Verteilung, mit der wir unsere erwarteten Werte erstellt haben. Zum Beispiel könnten wir testen, ob die Wahrscheinlichkeit des Erhaltensdurchwie wir es erwarten. Also drehen wir 100 Mal und findenund. Wir wollen unseren Befund mit dem vergleichen, was erwartet wird (). Wir könnten auch eine Binomialverteilung verwenden, aber das ist nicht der Punkt der Frage ... Die Frage ist:χ2H0headpnH Heads1nH tails100p

Können Sie bitte erklären, warum unter der Nullhypothese einer Chi-Quadrat-Verteilung folgt?(obsexp)2exp

Alles, was ich über die Chi-Quadrat-Verteilung weiß, ist, dass die Chi-Quadrat-Verteilung des Grades die Summe der Quadrat-Standardnormalverteilung ist.kkk

Remi.b
quelle
2
Es tut es nicht: Dies ist eine Annäherung. (Vieles) mehr dazu erscheint im Thread unter stats.stackexchange.com/questions/16921/… .
Whuber
Dies könnte für Karl Pearson und den Chi-Quadrat-Test von Interesse sein (Placket, 1983) {pdf}
Avraham,
Eine verwandte Frage darüber, warum die Chi-Quadrat-Verteilung für Fit-Tests verwendet wird, obwohl dies kein Duplikat ist: stats.stackexchange.com/questions/125312/…
Silverfish

Antworten:

12

Wir könnten auch eine Binomialverteilung verwenden, aber darum geht es nicht…

Trotzdem ist es unser Ausgangspunkt auch für Ihre eigentliche Frage. Ich werde es etwas informell abdecken.

Betrachten wir den Binomialfall allgemeiner:

YBin(n,p)

npYmin(np,n(1p))np(1p)

(YE(Y))2/Var(Y)χ12Y

E(Y)=npVar(Y)=np(1p)

npH0

(Ynp)2/np(1p)χ12

(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

Welches ist nur die Chi-Quadrat-Statistik für den Binomialfall.

In diesem Fall sollte die Chi-Quadrat-Statistik also die Verteilung des Quadrats einer (ungefähren) normalnormalen Zufallsvariablen haben.

Glen_b - Setzen Sie Monica wieder ein
quelle