Ich werde gebeten, eine Einführung in die Statistik zu schreiben, und ich habe Mühe, die Beziehung zwischen p-Wert und Leistung grafisch darzustellen. Ich habe mir dieses Diagramm ausgedacht:
Meine Frage: Gibt es eine bessere Möglichkeit, dies anzuzeigen?
Hier ist mein R-Code
x <- seq(-4, 4, length=1000)
hx <- dnorm(x, mean=0, sd=1)
plot(x, hx, type="n", xlim=c(-4, 8), ylim=c(0, 0.5),
ylab = "",
xlab = "",
main= expression(paste("Type II (", beta, ") error")), axes=FALSE)
axis(1, at = c(-qnorm(.025), 0, -4),
labels = expression("p-value", 0, -infinity ))
shift = qnorm(1-0.025, mean=0, sd=1)*1.7
xfit2 <- x + shift
yfit2 <- dnorm(xfit2, mean=shift, sd=1)
# Print null hypothesis area
col_null = "#DDDDDD"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null)
lines(x, hx, lwd=2)
# The alternative hypothesis area
## The red - underpowered area
lb <- min(xfit2)
ub <- round(qnorm(.975),2)
col1 = "#CC2222"
i <- xfit2 >= lb & xfit2 <= ub
polygon(c(lb,xfit2[i],ub), c(0,yfit2[i],0), col=col1)
## The green area where the power is
col2 = "#22CC22"
i <- xfit2 >= ub
polygon(c(ub,xfit2[i],max(xfit2)), c(0,yfit2[i],0), col=col2)
# Outline the alternative hypothesis
lines(xfit2, yfit2, lwd=2)
axis(1, at = (c(ub, max(xfit2))), labels=c("", expression(infinity)),
col=col2, lwd=1, lwd.tick=FALSE)
legend("topright", inset=.05, title="Color",
c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2), horiz=FALSE)
abline(v=ub, lwd=2, col="#000088", lty="dashed")
arrows(ub, 0.45, ub+1, 0.45, lwd=3, col="#008800")
arrows(ub, 0.45, ub-1, 0.45, lwd=3, col="#880000")
Aktualisieren
Vielen Dank für die tollen Antworten. Ich habe einen Teil des Codes geändert:
# Print null hypothesis area
col_null = "#AAAAAA"
polygon(c(min(x), x,max(x)), c(0,hx,0), col=col_null, lwd=2, density=c(10, 40), angle=-45, border=0)
lines(x, hx, lwd=2, lty="dashed", col=col_null)
...
legend("topright", inset=.015, title="Color",
c("Null hypoteses","Type II error", "True"), fill=c(col_null, col1, col2),
angle=-45,
density=c(20, 1000, 1000), horiz=FALSE)
Ich mag das gestrichelte, leicht vage Bild der Nullhypothese, weil es signalisiert, dass es nicht wirklich da ist. Ich habe über die Transparenz nachgedacht und die Alfa hinzugefügt, aber ich mache mir Sorgen, dass zu viele Informationen zu einem Bild zusammengefasst werden, und habe mich daher dagegen entschieden.
Die Einschränkungen von gedruckten Artikeln erlauben es mir nicht, die Leser experimentieren zu lassen. Ich habe die Antwort von @Greg Snow mit TeachingDemos als meine Antwort gewählt, da ich die Idee mit den beiden nicht überlappenden Fehlern liebe.
Antworten:
Ich habe mit ähnlichen Plots herumgespielt und festgestellt, dass es besser funktioniert, wenn sich die beiden Kurven nicht gegenseitig blockieren, sondern vertikal versetzt sind (aber immer noch auf derselben x-Achse). Dies macht deutlich, dass eine der Kurven die Nullhypothese darstellt und die andere einen gegebenen Wert für den Mittelwert unter der alternativen Hypothese darstellt. Die
power.examp
Funktion im TeachingDemos-Paket für R erstellt diese Diagramme. Mit derrun.power.examp
Funktion (dasselbe Paket) können Sie die Argumente interaktiv ändern und das Diagramm aktualisieren.quelle
TeachingDemos
Paket etwasEin paar Gedanken: (a) Transparenz verwenden und (b) Interaktivität zulassen.
Hier ist meine Ansicht, die weitgehend von einem Java-Applet zu Fehlern des Typs I und des Typs II inspiriert wurde - Fehler im Justizsystem . Da dies eher reiner Zeichencode ist, habe ich ihn als Gist # 1139310 eingefügt .
So sieht es aus:
quelle
aplpack
Paket enthält auch einige gute Add-Ons für Daten, nämlich. Allerdings ist das Rpanel , das ebenfalls auf tcl / tk basiert, wahrscheinlich eine bessere Option für komplexere Dinge. Mit RStudio und dem Manipulationspaket ist es jetzt auch einfach, dieG Power 3 , eine kostenlose Software für Mac und Windows, bietet einige sehr nützliche Grafikfunktionen für die Leistungsanalyse. Das Hauptdiagramm stimmt im Großen und Ganzen mit dem von @chl gezeigten Diagramm überein. Es wird eine einfache gerade Linie verwendet, um statistische Verteilungen für Nullhypothesen und alternative Hypothesentests sowie Farben in Beta und Alpha in separaten Farben anzugeben.
Ein nettes Feature von G Power 3 ist, dass es eine Vielzahl gängiger Szenarien für die Leistungsanalyse unterstützt und die Benutzeroberfläche Studenten und angewandten Forschern das Erforschen erleichtert.
Hier ist ein Screenshot einer Folie (entnommen aus einer Präsentation zu beschreibenden Statistiken mit einem Abschnitt zur Leistungsanalyse ) mit mehreren solchen Diagrammen auf der linken Seite. Wenn Sie sich für eine One-Tail-T-Test-Version entscheiden, ähnelt sie eher Ihrem Beispiel.
Es ist auch möglich, Diagramme zu erstellen, die die funktionale Beziehung zwischen Faktoren, die für die statistische Aussagekraft relevant sind, und Hypothesentests darstellen (z. B. Alpha, Effektgröße, Stichprobengröße, Aussagekraft usw.). Ich stelle ein paar Beispiele für solche Graphen hier . Hier ist ein Beispiel für ein solches Diagramm:
quelle