Warum verwendet der McNemar-Test Chi-Quadrat und nicht die Normalverteilung?

11

Mir ist gerade aufgefallen, dass der nicht exakte McNemar-Test die asymptotische Chi-Quadrat-Verteilung verwendet. Da der genaue Test (für die Tabelle mit zwei Fällen) jedoch von der Binomialverteilung abhängt, ist es nicht üblich, die normale Annäherung an die Binomialverteilung vorzuschlagen.

Vielen Dank.

Tal Galili
quelle

Antworten:

15

Eine nahezu intuitive Antwort:

Schauen Sie sich die Formel für den McNemar-Test anhand der Tabelle genauer an

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

Die McNemar-Statistik Mwird wie folgt berechnet:

M=(bc)2b+c

Die Definition einer Verteilung mit k Freiheitsgraden besteht darin, dass sie aus der Summe der Quadrate von k unabhängigen Standardnormalvariablen besteht. wenn die 4 Zahlen groß genug sind, und , und somit und durch eine Normalverteilung angenähert werden können. Angesichts der Formel für M ist leicht zu erkennen, dass bei ausreichend großen Werten tatsächlich ungefähr eine Verteilung mit 1 Freiheitsgrad folgt .χ 2χ2bcb-cb+cMχ2


BEARBEITEN: Wie zu Recht angegeben, ist die normale Annäherung tatsächlich völlig gleichwertig. Das ist angesichts des Arguments, das die Annäherung b-can die Normalverteilung verwendet , ziemlich trivial .

Die genaue Binomialversion entspricht auch dem Vorzeichentest in dem Sinne, dass in dieser Version die Binomialverteilung zum Vergleich bmit . Oder wir können sagen, dass unter der Nullhypothese die Verteilung von b durch angenähert werden kann .N ( 0,5 × ( b + c ) , 0,5 2 × ( b + c )Binom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)

Oder äquivalent:

b(b+c2)b+c2N(0,1)

was vereinfacht zu

bcb+cN(0,1)

oder, wenn das Quadrat auf beiden Seiten genommen wird, zu .Mχ12

Daher ist die normale Annäherung wird verwendet. Es ist dasselbe wie die Näherung.χ2

Joris Meys
quelle
3
Das ist richtig. Die Verbindung kann vielleicht deutlicher gesehen werden, wenn Sqrt (M) = (bc) / Sqrt (b + c) betrachtet wird. Wenn wir die Varianz von b als b und die Varianz von c als c approximieren (wie es bei gezählten Daten üblich ist), sehen wir, dass Sqrt (M) wie eine annähernd normale Variable (bc) geteilt durch ihre Standardabweichung aussieht: mit anderen Worten, es sieht aus wie eine normale Standardvariable . Tatsächlich könnten wir einen äquivalenten Test durchführen, indem wir Sqrt (M) auf eine Tabelle der Standardnormalverteilung verweisen. Durch effektives Quadrieren wird der Test symmetrisch zweiseitig. Offensichtlich bricht dies zusammen, wenn entweder b oder c klein ist.
whuber
Vielen Dank für die intuitive Antwort Joris. Warum ist es jedoch üblicher, diese Annäherung zu verwenden, als die normale Annäherung an den exakten Binomialtest von McNemar?
Tal Galili
@ Tal: Es ist das gleiche. Siehe nonstops Antwort und meine Bearbeitung.
Joris Meys
Eigentlich - letzte Frage. Wenn also beide identisch sind (und ich denke, Sie benötigen möglicherweise auch einen "absoluten Wert" um das BC), warum gehen die Leute dann zur Chi-Verteilung, anstatt bei der normalen zu bleiben? Wo ist der Vorteil?
Tal Galili
1
@Tal: Sie wissen, dass R. das Chi2 mit einem Freiheitsgrad plottet, Sie werden sehen.
Joris Meys
8

Werden die beiden Ansätze nicht dasselbe erreichen? Die relevante Chi-Quadrat-Verteilung hat einen Freiheitsgrad, also einfach die Verteilung des Quadrats einer Zufallsvariablen mit einer Standardnormalverteilung. Ich müsste die Algebra durchgehen, um zu überprüfen, wofür ich momentan keine Zeit habe, aber ich wäre überrascht, wenn Sie nicht in beide Richtungen genau dieselbe Antwort erhalten.

ein Stop
quelle
siehe meine Antwort für weitere Ausarbeitung
Joris Meys
Hi onestop - Da beide asymptotisch sind, können sie für kleinere Ns etwas unterschiedliche Ergebnisse liefern. In einem solchen Fall frage ich mich, ob die Wahl des Chi-Quadrats darauf zurückzuführen ist, dass es besser ist als die normale Annäherung, oder aus historischen Gründen (oder vielleicht, wie Sie vorgeschlagen haben - sie liefern immer identische Ergebnisse)
Tal Galili,
@Tal: Für kleineres N gilt keines von beiden. Und wie in meiner Bearbeitung gezeigt, sind sie genau gleich.
Joris Meys