Es ist normalerweise unkompliziert, eine Power Analysis
zu berechnen minimum sample size
, insbesondere in R , meiner bevorzugten statistischen Computerumgebung.
Ich werde jedoch gebeten, eine Leistungsanalyse durchzuführen, die sich ein wenig von allem unterscheidet, was ich getan habe oder auf die ich online verweisen kann. Ich frage mich, ob das, wonach ich gefragt werde, überhaupt möglich / gültig ist.
Das Projekt hat im Wesentlichen zwei unequal groups
Zustände und die Hypothese ist, dass sich diese beiden Gruppen hinsichtlich einer Ergebnisvariablen (dh der Dauer von Telefonanrufen an Kunden) erheblich unterscheiden. Die "Kontroll" -Gruppe besteht aus 40 Staaten und hat etwa 2.500 Beobachtungen hervorgebracht. Die "Test" -Gruppe hat ungefähr 10 Zustände und 500 Beobachtungen.
Anfangs fand ich Gruppe means
+ pooled standard deviation
, mit der ich eine berechnet habe Effect Size
. Dann habe ich ein Paket mit dem Namen pwr
in R
und festgestellt , dass ich eine Mindeststichprobengröße benötigt von etwa 135 Beobachtungen pro Gruppe, gegeben .05 Bedeutung und 0,8 Macht.
Sie lehnten meine Antwort jedoch ab, weil sie möchten, dass eine Gruppe viel größer ist als die andere, wie sie jetzt ist, und sie erwarten entweder zwei unterschiedliche Mindestanzahl von Beobachtungen pro Gruppe oder einen Mindestprozentsatz der Bevölkerung in Bezug auf die Anzahl der Staaten oder Beobachtungen, die in ihre "Test" -Gruppe gehen müssen.
Ich sehe Leistungsanalysen für zwei Stichproben-T-Tests (dh die R-Funktion pwr.t2n.test
), aber ich müsste mindestens eine der Stichprobengrößen angeben, während ich ihnen die minimale Stichprobengröße für beide Gruppen mitteilen soll (entweder als Zahlen oder Prozentsätze) und diese Funktion spiegelt nicht die Unterschiede in den Standardabweichungen für die beiden Gruppen wider.
Ist das möglich oder sage ich ihnen nur, dass es nicht so funktioniert (dh das Beste, was ich tun kann, ist ihnen zu sagen, dass bei einer der Stichprobengrößen und einer gepoolten Standardabweichung die zweite Gruppe mindestens eine bestimmte Größe haben muss)?
Zunächst einmal, warum nehmen Sie gleiche Varianzen in den beiden Gruppen an? Bitte sagen Sie nicht: "Weil es bequem ist." Ich bezweifle ernsthaft, dass die Gruppenvarianzen gleich sind, obwohl dies bei gleichen Stichprobengrößen nicht entscheidend ist. Ihre Freiheitsgrade werden ausgeschaltet sein, aber Sie wissen, dass Sie mindestens 130 haben. Wen interessiert das? Es gibt viel größere Fragen zu beantworten.
quelle