G-Test gegen Pearsons Chi-Quadrat-Test

10

Ich teste die Unabhängigkeit in einer Kontingenztabelle. Ich weiß nicht, ob der G-Test oder der Chi-Quadrat -Test von Pearson besser ist. Die Stichprobengröße liegt bei Hunderten, aber es gibt einige niedrige Zellzahlen. Wie auf der Wikipedia-Seite angegeben , ist die Annäherung an die Chi-Quadrat-Verteilung für den G-Test besser als für den Pearson-Chi-Quadrat-Test. Aber ich verwende die Monte-Carlo-Simulation, um den p-Wert zu berechnen. Gibt es also einen Unterschied zwischen diesen beiden Tests?N×M

oodkan
quelle
1
Siehe Deviance vs Pearson-Anpassungsgüte .
Scortchi - Monica wieder einsetzen

Antworten:

8

Sie sind asymptotisch gleich. Es sind nur verschiedene Wege, um zur gleichen Idee zu gelangen. Insbesondere ist der Pearson-Chi-Quadrat-Test ein Score-Test, während der G-Test ein Likelihood-Ratio-Test ist. Um ein besseres Gefühl für diese Ideen zu bekommen, kann es hilfreich sein, meine Antwort hier zu lesen: Warum unterscheiden sich meine p-Werte zwischen der logistischen Regressionsausgabe, dem Chi-Quadrat-Test und dem Konfidenzintervall für den OP? Um Ihre direkte Frage zu beantworten: Wenn Sie den p-Wert durch Monte-Carlo-Simulation berechnen, sollte dies keine Rolle spielen. Sie können einfach das verwenden, was für Sie am bequemsten ist. Beachten Sie, dass es kein Problem mit niedrigen Zellenzahlen gibt, nur (möglicherweise) niedrige erwarteteZellzahlen; Es ist möglich, niedrige Zellzahlen zu haben und erwartete Zählungen zu haben, die in Ordnung sind. Darüber hinaus sind weder niedrige tatsächliche Zählungen noch niedrige erwartete Zählungen von Bedeutung, wenn der p-Wert durch Simulation bestimmt wird.

(Für das, was es wert ist, würde ich wahrscheinlich Pearsons Chi-Quadrat verwenden, da R eine praktische Funktion für das hat, was die Option beinhaltet, den p-Wert zu simulieren.)

gung - Monica wieder einsetzen
quelle
Was ist die Funktion in R?
Llewmills
@llewmills , chisq.test.
Gung - Reinstate Monica
1

Schauen Sie sich Rfast an. https://cran.r-project.org/web/packages/Rfast/index.html Die relevanten Befehle sind g2Test_univariate (data, dc) g2Test_univariate_perm (data, dc, nperm) Die Berechnungen sind extrem schnell. Und im Allgemeinen bevorzugen Sie den G ^ 2-Test, da das Chi-Quadrat eine Annäherung daran ist.

Michail
quelle
0

Chi-Quadrat-Test und G-Test liefern normalerweise ähnliche Ergebnisse. Das Wichtigste dabei ist jedoch, dass Sie einen von zwei Tests auswählen und dabei bleiben, nicht nur für Ihren erwähnten Test, sondern auch für zukünftige Tests im Verlauf Ihrer Forschung. Es ist ratsam, denn wenn Sie versuchen, beide Tests austauschbar zu verwenden, ist es sehr wahrscheinlich, dass Sie die Wahrscheinlichkeit erhöhen, falsch positiv zu werden.

little_monster
quelle
1
Was ist die Begründung, mit der die Behauptung, dass die Wahrscheinlichkeit eines falschen Positivs erhöht wird? (Es sei denn, Sie wollten vorschlagen, dass der Test unter Bezugnahme auf die tatsächlichen Zählungen ausgewählt wird. Dann ist es jedoch die Bezugnahme auf die Zählungen, zwischen denen zu wählen, das Problem und nicht die Idee, Tests per se
möglicherweise auszutauschen.
2
@Glen_b Die Wahrscheinlichkeit, falsch positiv zu werden, steigt wahrscheinlich, wenn wir einen p-Wert des Tests wählen, der für unsere Annahmen günstiger ist (falls wir beide Tests versuchen)
little_monster