Wie lassen sich Fehler, Leistung und Stichprobengröße von Typ II (Beta) am besten grafisch darstellen?

16

Ich werde gebeten, eine Einführung in die Statistik zu schreiben, und ich habe Mühe, die Beziehung zwischen p-Wert und Leistung grafisch darzustellen. Ich habe mir dieses Diagramm ausgedacht:

Wechselwirkung mit zwei Gauß-Kurven

Meine Frage: Gibt es eine bessere Möglichkeit, dies anzuzeigen?

Hier ist mein R-Code

x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)

plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5), 
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4), 
     labels = expression("p-value", 0, -infinity ))

shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)

# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)

# The alternative hypothesis area

## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"

i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)

## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)

# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)

axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)), 
    col=col2, lwd=1, lwd.tick=FALSE)


legend("topright", inset=.05, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)

abline(v=ub, lwd=2, col="#000088", lty="dashed")

arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")

Aktualisieren


Vielen Dank für die tollen Antworten. Ich habe einen Teil des Codes geändert:

# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)

...
legend("topright", inset=.015, title="Color",
   c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), 
       angle=-45,
       density=c(20, 1000, 1000), horiz=FALSE)

Ich mag das gestrichelte, leicht vage Bild der Nullhypothese, weil es signalisiert, dass es nicht wirklich da ist. Ich habe über die Transparenz nachgedacht und die Alfa hinzugefügt, aber ich mache mir Sorgen, dass zu viele Informationen zu einem Bild zusammengefasst werden, und habe mich daher dagegen entschieden.

Bildbeschreibung hier eingeben

Die Einschränkungen von gedruckten Artikeln erlauben es mir nicht, die Leser experimentieren zu lassen. Ich habe die Antwort von @Greg Snow mit TeachingDemos als meine Antwort gewählt, da ich die Idee mit den beiden nicht überlappenden Fehlern liebe.

Max Gordon
quelle
4
Sie können Ihr Diagramm leicht verbessern, indem Sie Pseudotransparenz verwenden. So etwas wie in dieser Antwort .
caracal
@caracal (+1) Ich hätte ein schneidiges Muster (wie Sie) für den Bereich hinzufügen sollen, der die Leistung anzeigt.
chl
Das ist schön, ich habe ähnliche Handlungen woanders gesehen. Dies zeigt jedoch nicht die tatsächlichen Werte mehrerer p-Werte und die Leistung bei diesen p-Werten. Sie könnten Strom für verschiedene p - Werte und Stichprobengrößen berechnen und dann mehrere Zeilen in einem Diagramm setzen
Peter Flom - wieder einzusetzen Monica
1
Vielleicht ist es hilfreich, zu prüfen, wie die von der G * Power 3- Software erzeugten Diagrammtypen erstellt werden, um zu überlegen, was geplottet werden soll. Obwohl sie aus dem Gedächtnis sehr ähnlich zu dem scheinen, was chl und caracal bereits präsentiert haben (und Ihnen nicht helfen würden, wie man das in R macht).
Andy W
@Andy G * Power-inspirierte Power-gegen-Effekt-Größen-Diagramme oder Power-gegen-Alpha-Diagramme wären in der Tat eine nette Ergänzung. Für den ersten Fall könnte ein Anfang diese Antwort sein , die leicht an den zweiten Fall anpassbar sein sollte.
caracal

Antworten:

9

Ich habe mit ähnlichen Plots herumgespielt und festgestellt, dass es besser funktioniert, wenn sich die beiden Kurven nicht gegenseitig blockieren, sondern vertikal versetzt sind (aber immer noch auf derselben x-Achse). Dies macht deutlich, dass eine der Kurven die Nullhypothese darstellt und die andere einen gegebenen Wert für den Mittelwert unter der alternativen Hypothese darstellt. Die power.exampFunktion im TeachingDemos-Paket für R erstellt diese Diagramme. Mit der run.power.exampFunktion (dasselbe Paket) können Sie die Argumente interaktiv ändern und das Diagramm aktualisieren.

Greg Snow
quelle
+1, eine umfassendere Darstellung als meine. (Tatsächlich wusste ich, dass das TeachingDemosPaket etwas
enthielt
14

Ein paar Gedanken: (a) Transparenz verwenden und (b) Interaktivität zulassen.

Hier ist meine Ansicht, die weitgehend von einem Java-Applet zu Fehlern des Typs I und des Typs II inspiriert wurde - Fehler im Justizsystem . Da dies eher reiner Zeichencode ist, habe ich ihn als Gist # 1139310 eingefügt .

So sieht es aus:

Bildbeschreibung hier eingeben

H0

chl
quelle
Das ist wirklich großartig, ich hatte noch nie aplpack gesehen.
Ken Williams
1
@ Ken Danke. Das aplpackPaket enthält auch einige gute Add-Ons für Daten, nämlich. Allerdings ist das Rpanel , das ebenfalls auf tcl / tk basiert, wahrscheinlich eine bessere Option für komplexere Dinge. Mit RStudio und dem Manipulationspaket ist es jetzt auch einfach, die
Grunddarstellung
8

G Power 3 , eine kostenlose Software für Mac und Windows, bietet einige sehr nützliche Grafikfunktionen für die Leistungsanalyse. Das Hauptdiagramm stimmt im Großen und Ganzen mit dem von @chl gezeigten Diagramm überein. Es wird eine einfache gerade Linie verwendet, um statistische Verteilungen für Nullhypothesen und alternative Hypothesentests sowie Farben in Beta und Alpha in separaten Farben anzugeben.

Ein nettes Feature von G Power 3 ist, dass es eine Vielzahl gängiger Szenarien für die Leistungsanalyse unterstützt und die Benutzeroberfläche Studenten und angewandten Forschern das Erforschen erleichtert.

Hier ist ein Screenshot einer Folie (entnommen aus einer Präsentation zu beschreibenden Statistiken mit einem Abschnitt zur Leistungsanalyse ) mit mehreren solchen Diagrammen auf der linken Seite. Wenn Sie sich für eine One-Tail-T-Test-Version entscheiden, ähnelt sie eher Ihrem Beispiel.

g macht 3 Graphen

Es ist auch möglich, Diagramme zu erstellen, die die funktionale Beziehung zwischen Faktoren, die für die statistische Aussagekraft relevant sind, und Hypothesentests darstellen (z. B. Alpha, Effektgröße, Stichprobengröße, Aussagekraft usw.). Ich stelle ein paar Beispiele für solche Graphen hier . Hier ist ein Beispiel für ein solches Diagramm:

Bildbeschreibung hier eingeben

Jeromy Anglim
quelle
Interessantes Paket, ich werde es in Zukunft untersuchen. Die Grafiken scheinen jedoch für jemanden, der neu auf dem Gebiet ist, etwas kompliziert zu sein. Mein Publikum sind MDs ohne mathematische oder statistische Hintergrundkenntnisse. Vielen Dank!
Max Gordon