Proportionsvergleich mit zwei Stichproben, Schätzung der Stichprobengröße: R vs Stata

10

Proportionsvergleich mit zwei Stichproben, Schätzung der Stichprobengröße: R vs Stata

Ich habe verschiedene Ergebnisse für Stichprobengrößen erhalten, wie folgt:

In R.

power.prop.test(p1 = 0.70, p2 = 0.85, power = 0.90, sig.level = 0.05)

Ergebnis: (also 161) für jede Gruppe.n=160.7777

In Stata

sampsi 0.70 0.85, power(0.90) alpha(0.05)

Ergebnis: für jede Gruppe.n=174

Warum der Unterschied? Vielen Dank.

Übrigens habe ich in SAS JMP dieselbe Stichprobengrößenberechnung durchgeführt , das Ergebnis: (fast das gleiche wie das R-Ergebnis).n=160

dwstu
quelle

Antworten:

7

Der Unterschied ist auf die Tatsache zurückzuführen, dass der sampsiBefehl von Stata (veraltet ab Stata 13 und ersetzt durch power) standardmäßig die Kontinuitätskorrektur verwendet, während der von R power.prop.test()dies nicht tut (Einzelheiten zu der von Stata verwendeten Formel finden Sie unter [PSS] -Power-Twoproportions ). Dies kann mit der nocontinuityOption geändert werden , z.

sampsi 0.70 0.85, power(0.90) alpha(0.05) nocontinuity

Dies ergibt eine Stichprobengröße von 161 pro Gruppe. Die Verwendung der Kontinuitätskorrektur ergibt einen konservativeren Test (dh eine größere Stichprobengröße) und ist offensichtlich mit zunehmender Stichprobengröße weniger wichtig.

Frank Harrell weist in der Dokumentation für bpower(Teil seines Hmisc- Pakets) darauf hin, dass die Formel ohne die Kontinuitätskorrektur ziemlich genau ist, was eine Rechtfertigung für den Verzicht auf die Korrektur darstellt.

Phil Schumm
quelle
2
Gute Antwort. Es scheint, dass nicht der Unterschied zwischen den beiden Methoden in meinem Beitrag die Ursache für den Unterschied ist, sondern die Tatsache, dass eine dieser Methoden die Kontinuitätskorrektur verwendet und die andere nicht.
Michael M
1
Vielen Dank. Bei nur zwei Proportionen (dh einer 2x2-Tabelle) spielt es keine Rolle, ob Sie die Alternative als zwei Proportionen oder als einen Anteil und ein Quotenverhältnis angeben. Und da der Fisher's Exact Test für das Binomialproblem mit zwei Stichproben konservativ ist, liegen die darauf basierenden Leistungsschätzungen näher an denen der kontinuitätskorrigierten Formel.
Phil Schumm
1
Danke @pschumm. Ich habe Hmisc- Pakete ausprobiert bsamsize(0.70, 0.85, alpha=0.05, power=0.90)und . n1=n2=160.7777
Dwstu