Leistungsanalyse für Binomialdaten, wenn die Nullhypothese lautet, dass

Ich möchte eine Leistungsanalyse für eine einzelne Stichprobe aus Binomialdaten mit und , wobei der Anteil der Erfolge in der Bevölkerung ist. Wenn , könnte ich entweder die normale Annäherung an das Binomial oder den Test verwenden, aber mit schlagen beide fehl. Ich würde gerne wissen, ob es eine Möglichkeit gibt, diese Analyse durchzuführen. Ich würde mich über Vorschläge, Kommentare oder Referenzen sehr freuen. Danke vielmals! $H_0: p = 0$ $H_1: p = 0.001$ $p$ $0 < p <1$ $\chi^2$ $p =0$

hypothesis-testing sample-size power-analysis power user765195
quelle

Warum verwenden Sie nicht den exakten Clopper-Pearson-Test?

Stéphane Laurent

Ich hoffe du hast eine wirklich große Probe! Dies wird schwer zu testen sein.

Peter Flom - Monica wieder einsetzen

Antworten:

Sie haben eine einseitige, exakte Alternativhypothese wobei und . $p_{1} > p_{0}$ $p_{1} = 0.001$ $p_{0} = 0$

Der erste Schritt besteht darin, einen Schwellenwert für die Anzahl der Erfolge zu identifizieren, so dass die Wahrscheinlichkeit, mindestens Erfolge in einer Stichprobe der Größe erzielen, unter der Nullhypothese sehr gering ist (herkömmlicherweise ). In Ihrem Fall ist , unabhängig von Ihrer speziellen Wahl für und . $c$ $c$ $n$ $\alpha = 0.05$ $c=1$ $n \geqslant 1$ $\alpha > 0$
Der zweite Schritt besteht darin, die Wahrscheinlichkeit herauszufinden, mit der unter der alternativen Hypothese mindestens Erfolge in einer Stichprobe der Größe erzielt werden können - dies ist Ihre Stärke. Hier benötigen Sie ein festes , sodass die Binomialverteilung vollständig angegeben ist. $c$ $n$ $n$ $\mathcal{B}(n, p_{1})$

Der zweite Schritt in R mit : $n = 500$

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

Um eine Vorstellung davon zu bekommen, wie sich die Leistung mit der Stichprobengröße ändert, können Sie eine Leistungsfunktion zeichnen: Geben Sie hier die Bildbeschreibung ein

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

Wenn Sie wissen möchten, welche Stichprobengröße Sie benötigen, um mindestens eine vorgegebene Leistung zu erzielen, können Sie die oben berechneten Leistungswerte verwenden. Angenommen, Sie möchten eine Leistung von mindestens . $0.5$

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

Sie benötigen also eine Stichprobengröße von mindestens , um eine Potenz von . $693$ $0.5$

Karakal
quelle

Entsprechend pwr.p.testbenötigen Sie für eine Potenz von 0,5 mindestens 677 Beobachtungen. Aber Leistung = 0,5 ist sehr gering!

Jessica

@caracal Verwenden Sie eine normale Näherung, um Ihre Leistungskurve zu erhalten? Eine exakte Binomialleistungsfunktion wäre nicht so reibungslos. Es ist tatsächlich sägezahnförmig, was Sie sehen können, wenn die Probengrößenachse vergrößert wird. Ich diskutiere dies in meinem Artikel von 2002 in der amerikanischen Statistikerin, die gemeinsam mit Christine Liu verfasst wurde. Auch das Binomial ist bei sehr niedrigem p so stark verzerrt, dass n groß sein muss, damit die normale Näherung gut funktioniert.

Michael R. Chernick

@MichaelChernick Nein, dies ist aus den Binomialverteilungen, nicht aus einer normalen Näherung. Natürlich haben Sie Recht, dass die Leistung für einen Binomialtest im Allgemeinen eine Sägezahnfunktion ist, die nicht monoton ist. Beachten Sie jedoch, dass wir hier einen Sonderfall mit . Dies bedeutet, dass der Akzeptanzbereich für die alternative Hypothese unabhängig von immer bei 1 beginnt . Bei einer konstanten Schwelle , einer Konstanten ist die Leistung eine streng zunehmende Funktion von .

p_{0} = 0

$p_{0} = 0$

n

$n$

c = 1

$c = 1$

p_{1} = 0.001

$p_{1} = 0.001$

n

$n$

Caracal

@Jessica Beachten Sie, dass pwr.p.test()eine normale Näherung verwendet wird, nicht die exakten Binomialverteilungen. Geben Sie einfach pwr.p.testein, um den Quellcode anzuzeigen. Sie finden die Aufrufe, um pnorm()anzuzeigen, dass eine Annäherung verwendet wird.

Caracal

@caracal Also kann ich es so sehen: Unter der Nullhypothese ist die Erfolgswahrscheinlichkeit 0, daher können Sie die Nullhypothese ablehnen, wenn Sie jemals einen Erfolg sehen. Deshalb sagen Sie, der Schwellenwert ist 1, denn wenn die Binomialsumme jemals 1 wird, können Sie mit einem Typ-2-Fehler von 0 ablehnen! Unter der Alternative beträgt die Wahrscheinlichkeit des ersten Erfolgs beim n-ten Versuch (1-p) p. Diese Wahrscheinlichkeit geht auf 0, wenn n auf unendlich geht. Eine sequentielle Regel, die vorbeigeht, wenn S = 1 ist, hätte also die Potenz 1 für jedes p> 0.

^{n}

$^n$

^{-}

$^-$

^{1}

$^1$

_{n}

$_n$

Michael R. Chernick

Sie können diese Frage einfach mit dem pwrPaket in R beantworten .

Sie müssen ein Signifikanzniveau, eine Stärke und eine Effektgröße definieren. In der Regel wird das Signifikanzniveau auf 0,05 und die Leistung auf 0,8 eingestellt. Höhere Leistung erfordert mehr Beobachtungen. Ein niedrigeres Signifikanzniveau verringert die Leistung.

Die Effektgröße für die in diesem Paket verwendeten Proportionen ist Cohens h. Der Cutoff für ein kleines h wird oft mit 0,20 angenommen. Der tatsächliche Grenzwert variiert je nach Anwendung und kann in Ihrem Fall kleiner sein. Ein kleineres h bedeutet, dass mehr Beobachtungen erforderlich sind. Sie sagten, Ihre Alternative sei . Das ist sehr klein $p = 0.001$

> ES.h(.001, 0)
[1] 0.0632561

Aber wir können trotzdem weitermachen.

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

Mit diesen Werten benötigen Sie mindestens 1546 Beobachtungen.

Jessica
quelle

In Ihrem speziellen Fall gibt es eine einfache genaue Lösung:

Unter der speziellen Nullhypothese sollten Sie niemals einen Erfolg beobachten. Sobald Sie also einen Erfolg beobachten, können Sie sicher sein, dass . $H_0: p=0$ $p\neq0$

Unter der Alternative Die Anzahl der Versuche, die erforderlich sind, um mindestens 1 Erfolg zu beobachten, folgt einer geometrischen Verteilung. Um die minimale Stichprobengröße zu erhalten, um eine Potenz von , müssen Sie das kleinste k so finden, dass $H_1: p=0.001$ $1-\beta$

1 - β \leq 1 - (1 - p)^{(k - 1)}

$1-\beta \leq 1-(1-p)^{(k-1)}$

Mit , um Leistung zu erhalten, würden Sie mindestens 1610 Samples benötigen. $p=0.001$ $80%$

schweben
quelle

Beim Lesen der Kommentare zu Lösung 1 stelle ich fest, dass dies im Wesentlichen dieselbe Lösung ist wie die, die Sie erhalten, wenn Sie sich an eine Antwort halten. Trotzdem schadet es nie, einige grundlegende Ergebnisse der Wahrscheinlichkeitstheorie zu formulieren, ohne dass man durch Intuition dorthin gelangen muss.

Float