Ich teste die Unabhängigkeit in einer Kontingenztabelle. Ich weiß nicht, ob der G-Test oder der Chi-Quadrat -Test von Pearson besser ist. Die Stichprobengröße liegt bei Hunderten, aber es gibt einige niedrige Zellzahlen. Wie auf der Wikipedia-Seite angegeben , ist die Annäherung an die Chi-Quadrat-Verteilung für den G-Test besser als für den Pearson-Chi-Quadrat-Test. Aber ich verwende die Monte-Carlo-Simulation, um den p-Wert zu berechnen. Gibt es also einen Unterschied zwischen diesen beiden Tests?
10
Antworten:
Sie sind asymptotisch gleich. Es sind nur verschiedene Wege, um zur gleichen Idee zu gelangen. Insbesondere ist der Pearson-Chi-Quadrat-Test ein Score-Test, während der G-Test ein Likelihood-Ratio-Test ist. Um ein besseres Gefühl für diese Ideen zu bekommen, kann es hilfreich sein, meine Antwort hier zu lesen: Warum unterscheiden sich meine p-Werte zwischen der logistischen Regressionsausgabe, dem Chi-Quadrat-Test und dem Konfidenzintervall für den OP? Um Ihre direkte Frage zu beantworten: Wenn Sie den p-Wert durch Monte-Carlo-Simulation berechnen, sollte dies keine Rolle spielen. Sie können einfach das verwenden, was für Sie am bequemsten ist. Beachten Sie, dass es kein Problem mit niedrigen Zellenzahlen gibt, nur (möglicherweise) niedrige erwarteteZellzahlen; Es ist möglich, niedrige Zellzahlen zu haben und erwartete Zählungen zu haben, die in Ordnung sind. Darüber hinaus sind weder niedrige tatsächliche Zählungen noch niedrige erwartete Zählungen von Bedeutung, wenn der p-Wert durch Simulation bestimmt wird.
(Für das, was es wert ist, würde ich wahrscheinlich Pearsons Chi-Quadrat verwenden, da R eine praktische Funktion für das hat, was die Option beinhaltet, den p-Wert zu simulieren.)
quelle
chisq.test
.Schauen Sie sich Rfast an. https://cran.r-project.org/web/packages/Rfast/index.html Die relevanten Befehle sind g2Test_univariate (data, dc) g2Test_univariate_perm (data, dc, nperm) Die Berechnungen sind extrem schnell. Und im Allgemeinen bevorzugen Sie den G ^ 2-Test, da das Chi-Quadrat eine Annäherung daran ist.
quelle
Chi-Quadrat-Test und G-Test liefern normalerweise ähnliche Ergebnisse. Das Wichtigste dabei ist jedoch, dass Sie einen von zwei Tests auswählen und dabei bleiben, nicht nur für Ihren erwähnten Test, sondern auch für zukünftige Tests im Verlauf Ihrer Forschung. Es ist ratsam, denn wenn Sie versuchen, beide Tests austauschbar zu verwenden, ist es sehr wahrscheinlich, dass Sie die Wahrscheinlichkeit erhöhen, falsch positiv zu werden.
quelle