Der Z-Test zum Vergleichen von zwei Proportionen lautet . Normalerweise wird das definiert
wo
Gibt es eine schriftliche Referenz, die mich legitimiert, stattdessen die nicht gepoolte Varianz zu verwenden?
Der Z-Test zum Vergleichen von zwei Proportionen lautet . Normalerweise wird das definiert
wo
Gibt es eine schriftliche Referenz, die mich legitimiert, stattdessen die nicht gepoolte Varianz zu verwenden?
Auf der AP-Site wird darüber viel diskutiert .
Sie können jede gewünschte Statistik verwenden, vorausgesetzt, Sie wissen genau, was Sie tun, und sehen sich die entsprechende Nullverteilung an, um p-Werte oder Schwellenwerte zu berechnen.
Einige Statistiken sind jedoch besser als andere. In diesem Fall würden Sie nach (a) einer leicht zu berechnenden Nullverteilung und (b) einer Fähigkeit zur Erkennung von Unterschieden suchen.
Aber ich weiß nicht, warum Sie die nicht gepoolte Varianz gegenüber der gepoolten Varianz für den Test bevorzugen würden, obwohl dies bei der Berechnung eines Konfidenzintervalls für die Differenz bevorzugt werden könnte.
Die nicht gepoolte Varianz ist tendenziell zu klein. Dies liegt daran, dass unter der Nullhypothese immer noch zufällige Variationen in den beiden beobachteten Anteilen auftreten, obwohl die zugrunde liegenden Wahrscheinlichkeiten gleich sind. Diese Zufallsvariation trägt zur gepoolten Varianz bei, jedoch nicht zur nicht gepoolten Varianz.
Infolgedessen hat für die nicht gepoolte Statistik nicht einmal annähernd eine Standardnormalverteilung. Wenn zum Beispiel und die wahren Wahrscheinlichkeiten beide , ist die Varianz von nur anstelle von . Wenn Sie Tabellen der Standardnormalverteilung verwenden, erhalten Sie falsche p-Werte: Sie sind in der Regel künstlich klein und lehnen die Null zu oft ab, wenn die Beweise nicht wirklich vorhanden sind.n 1 = n 2z n1= n2 z 1 / 2 11 / 2 z 1 / 2 1
Trotzdem fragt man sich, ob dies korrigiert werden könnte. Es kann. Es stellt sich die Frage, ob ein korrigierter Wert von , der auf nicht gepoolten Schätzungen basiert, eine größere Fähigkeit haben könnte, Abweichungen von der Nullhypothese zu erkennen. Einige schnelle Simulationen legen nahe, dass dies nicht der Fall ist: Der gepoolte Test (im Vergleich zu einem ordnungsgemäß angepassten nicht gepoolten Test) hat eine bessere Chance, die Null abzulehnen, wenn die Null falsch ist. Daher habe ich mir nicht die Mühe gemacht, die Formel für die nicht gepoolte Korrektur auszuarbeiten. es scheint sinnlos.z
Zusammenfassend ist der nicht gepoolte Test falsch, aber mit einer geeigneten Korrektur kann er legitimiert werden. Es scheint jedoch dem gepoolten Test unterlegen zu sein.
quelle