Parametrische Probengrößenberechnung und nicht parametrische Analyse

12

Ich bin gespannt, ob jemand eine bestimmte Referenz (Text oder einen Zeitschriftenartikel) hat, um die in der medizinischen Literatur übliche Praxis der Berechnung der Probengröße mit parametrischen Methoden (dh unter der Annahme einer Normalverteilung und einer bestimmten Varianz der Messungen) zu unterstützen. wenn die Analyse des primären Versuchsergebnisses mit nichtparametrischen Methoden durchgeführt wird.

Ein Beispiel: Das primäre Ergebnis ist die Zeit bis zum Erbrechen nach Gabe eines bestimmten Arzneimittels. Es ist bekannt, dass es einen Mittelwert von 20 Minuten (SD 6 Minuten) hat, jedoch eine merklich rechtwinklige Verteilung aufweist. Die Berechnung des Stichprobenumfangs erfolgt mit den oben aufgeführten Annahmen unter Verwendung der Formel

,n(pro Gruppe)=f(α,β)×(2σ2/(μ1-μ2)2)

wobei sich basierend auf den gewünschten α- und β- Fehlern ändert .f(α,β)αβ

Aufgrund der Schiefe der Verteilung basiert die Analyse des primären Ergebnisses jedoch auf Rängen (nicht parametrische Methode wie der Mann Whitney U-Test).

Kann dieses Schema von Autoren in der statistischen Literatur unterstützt werden, oder sollten nichtparametrische Stichprobengrößenschätzungen durchgeführt werden (und wie würden diese durchgeführt werden)?

Ich bin der Meinung, dass es zur Vereinfachung der Berechnung akzeptabel ist, die obige Übung durchzuführen. Schließlich sind Schätzungen des Stichprobenumfangs genau das - Schätzungen, die bereits einige Annahmen treffen - die alle wahrscheinlich geringfügig (oder sehr ungenau) sind. Ich bin jedoch neugierig zu wissen, was andere denken, und speziell zu wissen, ob es Referenzen gibt, die diese Argumentation stützen.

Vielen Dank für jede Hilfe.

pmgjones
quelle

Antworten:

4

Es klingt für mich zwielichtig. Nichtparametrische Methoden beinhalten fast immer mehr Freiheitsgrade als parametrische Methoden und benötigen daher mehr Daten. In Ihrem speziellen Beispiel hat der Mann-Whitney-Test eine geringere Leistung als der t-Test, sodass für dieselbe angegebene Leistung und Größe mehr Daten erforderlich sind.

Eine einfache Methode zur Berechnung der Stichprobengröße für eine beliebige Methode (nicht parametrisch oder anderweitig) ist die Verwendung eines Bootstrap-Ansatzes.

Rob Hyndman
quelle
5
Ich stimme Ihnen zu, obwohl die meisten Berechnungen des Stichprobenumfangs bei der Erstellung von RCTs auf parametrischen Modellen basieren. Ich mag den Bootstrap-Ansatz, aber es scheint, dass nur sehr wenige Studien darauf vertrauen. Ich habe gerade die Papiere gefunden, die interessant sein könnten: bit.ly/djzzeS , bit.ly/atCWz3 , und diese gehen in die entgegengesetzte Richtung bit.ly/cwjTHe für Gesundheitsmaßstäbe.
CHL
6
Ich stimme dem Bootstrap-Ansatz zu. Macht ist jedoch keine Funktion von Freiheitsgraden. In vielen Fällen, einschließlich diesem, hat der Mann-Whitney-Test häufig eine größere Aussagekraft als der t-Test. Siehe tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf . Im Allgemeinen ist die Aussagekraft eines parametrischen Tests gut, wenn die parametrischen Annahmen zutreffen, kann jedoch - manchmal drastisch - niedriger sein, wenn diese Annahmen verletzt werden, wohingegen gute nichtparametrische Tests ihre Aussagekraft beibehalten.
Whuber
@RobHyndman - Entschuldigung, dass ich einen alten Thread von vor 6 Jahren ausgegraben habe, aber ich frage mich, ob Sie einen Verweis für Ihren letzten Satz liefern können. Wie kann ich einen Bootstrap-Ansatz verwenden, um eine Stichprobengrößenberechnung zu erhalten? Ich gehe hier davon aus, dass ich die Daten noch nicht erfasst habe (weil ich herausfinden möchte, wie viel erfasst werden muss), aber ich kenne die Leistung, die ich möchte, das Signifikanzniveau und die Effektgröße, die ich erkennen möchte. Vielen Dank!
David White
Okay, ich denke, das kann nur funktionieren, wenn Sie eine vorläufige Studie haben, aus der Sie ein Resample erstellen können. Für eine erste Studie ohne Vorkenntnisse ist es am besten, die Effektgröße aus der Normalverteilung (oder aus einer anderen Verteilung, wenn die Theorie vorschlägt, dass die Daten auf diese Weise verteilt werden sollten) zu berechnen und ein wenig hinzuzufügen, um mögliche Abweichungen zu berücksichtigen. Sobald Sie über eine Studie verfügen, können Sie mithilfe von Boostrapping die Stichprobengrößen berechnen, um in nachfolgenden Studien verschiedene Effektgrößen zu ermitteln. Sie könnten sogar eine Kurve der Effektgröße gegen n anpassen, indem Sie mehrere Werte von n booten.
David White
4

Einige Leute scheinen ein Konzept der Pitman Asymptotic Relative Efficiency (ARE) zu verwenden, um die Stichprobengröße zu erhöhen, die unter Verwendung einer Stichprobengrößenformel für einen parametrischen Test erhalten wurde. Ironischerweise muss man, um es zu berechnen, erneut von einer Verteilung ausgehen ... siehe z. B. Stichprobengröße für den Mann-Whitney-U-Test Am Ende des Artikels befinden sich einige Links, die Hinweise zum weiteren Lesen geben.

psj
quelle