Wie visualisiere ich einen unabhängigen T-Test mit zwei Stichproben?

11

Was sind die am meisten akzeptierten Möglichkeiten, um die Ergebnisse eines unabhängigen T-Tests mit zwei Stichproben zu visualisieren? Wird eine numerische Tabelle häufiger verwendet oder eine Art Diagramm? Das Ziel ist, dass ein gelegentlicher Beobachter die Figur betrachtet und sofort erkennt, dass sie wahrscheinlich aus zwei verschiedenen Bevölkerungsgruppen stammen.

backen
quelle
Von wem "akzeptiert", in welchem ​​Kontext? "Häufiger verwendet" wo?
Glen_b -State Monica

Antworten:

18

Es lohnt sich, über den Zweck Ihrer Handlung klar zu sein. Im Allgemeinen gibt es zwei verschiedene Arten von Zielen: Sie können Diagramme für sich selbst erstellen, um die von Ihnen getroffenen Annahmen zu bewerten und den Datenanalyseprozess zu steuern, oder Sie können Diagramme erstellen, um anderen ein Ergebnis mitzuteilen. Diese sind nicht gleich; Beispielsweise können viele Betrachter / Leser Ihrer Handlung / Analyse statistisch nicht anspruchsvoll sein und sind möglicherweise nicht mit der Idee der beispielsweise gleichen Varianz und ihrer Rolle in einem T-Test vertraut. Sie möchten, dass Ihr Grundstück die wichtigen Informationen über Ihre Daten auch Verbrauchern wie diesen vermittelt. Sie vertrauen implizit darauf, dass Sie die Dinge richtig gemacht haben. Aus Ihrem Fragen-Setup geht hervor, dass Sie nach dem letzteren Typ suchen.

Realistisch gesehen ist das häufigste und am meisten akzeptierte Diagramm zur Übermittlung der Ergebnisse eines T-Tests 1 an andere (abgesehen davon, ob es tatsächlich am besten geeignet ist) ein Balkendiagramm mit Mitteln mit Standardfehlerbalken. Dies passt sehr gut zum t-Test, da ein t-Test zwei Mittelwerte anhand ihrer Standardfehler vergleicht. Wenn Sie zwei unabhängige Gruppen haben, erhalten Sie ein Bild, das selbst für statistisch nicht anspruchsvolle Personen intuitiv ist, und (datenwillige) Personen können "sofort erkennen, dass sie wahrscheinlich aus zwei verschiedenen Bevölkerungsgruppen stammen". Hier ist ein einfaches Beispiel unter Verwendung der Daten von @ Tim:

nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m        = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se       = c(sd(nonsmokers)/sqrt(length(nonsmokers)), 
             sd(smokers)/sqrt(length(smokers)))
windows()
  bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
  box()
  arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)

Geben Sie hier die Bildbeschreibung ein

Allerdings verachten Datenvisualisierungsspezialisten diese Diagramme normalerweise. Sie werden oft als "Dynamitplots" verspottet (vgl. Warum Dynamitplots schlecht sind ). Insbesondere wenn Sie nur wenige Daten haben, wird häufig empfohlen, die Daten einfach selbst anzuzeigen . Wenn sich die Punkte überlappen, können Sie sie horizontal zittern lassen (ein wenig zufälliges Rauschen hinzufügen), damit sie sich nicht mehr überlappen. Da es bei einem T-Test im Wesentlichen um Mittelwerte und Standardfehler geht, ist es am besten, die Mittelwerte und Standardfehler auf ein solches Diagramm zu legen. Hier ist eine andere Version:

set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, 
     xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)

Geben Sie hier die Bildbeschreibung ein

Wenn Sie viele Daten haben, sind Boxplots möglicherweise die bessere Wahl, um einen schnellen Überblick über die Verteilungen zu erhalten, und Sie können dort auch die Mittelwerte und SEs überlagern.

data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m  = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see

Geben Sie hier die Bildbeschreibung ein

Einfache Darstellungen der Daten und Boxplots sind so einfach, dass die meisten Menschen sie verstehen können, auch wenn sie statistisch nicht sehr versiert sind. Bedenken Sie jedoch, dass keines davon die Beurteilung der Gültigkeit eines T-Tests zum Vergleich Ihrer Gruppen erleichtert. Diese Ziele werden am besten durch verschiedene Arten von Handlungen erreicht.

1. Beachten Sie, dass diese Diskussion einen unabhängigen Stichproben-T-Test voraussetzt. Diese Diagramme könnten mit einem T-Test für abhängige Stichproben verwendet werden, könnten aber auch in diesem Zusammenhang irreführend sein (vgl. Ist die Verwendung von Fehlerbalken für Mittelwerte in einer Studie innerhalb der Probanden falsch? ).

gung - Monica wieder einsetzen
quelle
Ein großes Problem bei der Verwendung des Balkens + CI-Diagramms besteht darin, dass der Unterschied manchmal statistisch signifikant ist, sich die CIs jedoch überlappen . Angesichts der Tatsache, dass die Bar + CI-Handlung versucht, ein allgemeines Publikum anzusprechen, möchten wir wirklich keine Zeit damit verbringen, diese zusätzliche Falte zu erklären.
Heisenberg
@ Heisenberg, das weiß ich. Es gibt keine einzige, perfekte Handlung für alle Gelegenheiten und Zwecke. Ich habe auch keine CIs erwähnt, nur SEs (obwohl das je nach df einigen CIs entsprechen würde). Die Bedeutung wird häufig in der Bildunterschrift erwähnt und im Text erörtert. Wenn Sie möchten, dass es im Diagramm selbst eindeutig angezeigt wird, können Sie Klammern und p-Werte hinzufügen (z . B. hier ).
Gung - Reinstate Monica
Ich entschuldige mich, wenn der Ton aggressiv klingt. Ich bin nur ein wenig verärgert darüber, dass es am Ende immer noch keine elegante Möglichkeit gibt, einen T-Test einem generalistischen Publikum vorzustellen, ohne es weiter zu erklären. Es kann sich um das Zeichnen handeln: 2 Balkendiagramme mit Gruppenmitteln mit SE und ein drittes Diagramm mit dem Unterschied und seinem CI (wie Ihr Link ). Eine solche Visualisierung zeigt jedoch redundante Informationen (Gruppenmittel UND Mittelunterschiede), die auch das Publikum verwirren könnten.
Heisenberg
@ Heisenberg, ich würde die Darstellung aus meiner anderen Antwort nur verwenden, wenn ich versuchen würde, einen T-Test innerhalb des Patienten anzuzeigen. Ich denke, es ist wahrscheinlich oft in Ordnung, 2 Takte mit SEs für einen T-Test mit einer einfachen Bildunterschrift zu präsentieren. Wenn Sie eine Bedeutung in der Handlung benötigen , können Sie Klammern oder ähnliches hinzufügen (ich finde das im Allgemeinen unnötig).
Gung - Reinstate Monica
14

Die am häufigsten verwendete Methode zur Visualisierung des Test-ähnlichen Vergleichs ist die Verwendung von Boxplots . Im Folgenden gebe ich ein Beispiel mit einem Datensatz, der die "Beziehung zwischen dem Rauchen von Marihuana und einem Leistungsdefizit bei einer Aufgabe zur Messung des Kurzzeitgedächtnisses" auf dieser Website beschreibt .t

> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
> 
> t.test(nonsmokers, smokers)

    Welch Two Sample t-test

data:  nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1628205 5.0371795
sample estimates:
mean of x mean of y 
     20.1      17.5 

Geben Sie hier die Bildbeschreibung ein

Tatsächlich werden Boxplots üblicherweise für "informelle" Hypothesentests verwendet, beispielsweise wie von Yoav Benjamini in der 1988 erschienenen Veröffentlichung " Opening the Box of a Boxplot" beschrieben :

Das reguläre Boxplot wird durch ein ungefähres Konfidenzintervall für den Median der Charge ergänzt, das als Paar Keile angezeigt wird, die aus den Seiten der Box herausgenommen wurden. Diese Konfidenzintervalle sind so aufgebaut, dass sich ihre Mediane signifikant unterscheiden, wenn sich zwei Kerben unterschiedlicher Boxplots nicht überlappen. (...) Da die Formel für das Konfidenzintervall eine Konstante mal dem Interquartilbereich geteilt durch die Quadratwurzel der Chargengröße ist, kann letztere anhand der Länge der Keile im Verhältnis zur Länge der Box wahrgenommen werden.

Siehe auch: T-Test, bei dem nur zusammenfassende Daten in einem Box-Plot verwendet werden

Dieses Diagramm zeigt keine Mengen, die direkt am Test beteiligt sind , wie @NickCox bemerkt hat. Wenn Sie Mittelwerte direkt mit Konfidenzintervallen vergleichen möchten, können Sie ein Balkendiagramm mit markierten Konfidenzintervallen verwenden. Mit Hilfe von Mitteln und Konfidenzintervallen können Sie auch einen Hypothesentest durchführen (siehe hier oder hier ).t

Geben Sie hier die Bildbeschreibung ein

Wie Sie anderen Beiträgen und Kommentaren in diesem Thread entnehmen können, sind sowohl Boxplots als auch Dynamitplots eine etwas kontroverse Wahl. Lassen Sie mich Ihnen eine weitere Alternative geben, die noch nicht erwähnt wurde. Denken Sie zunächst daran, dass Test und Regression zusammenhängen . Sie können einen Test-ähnlichen Vergleich als zwei Punkte mit Fehlerbalken (Konfidenzintervallen) darstellen, die mit der Linie verbunden sind. Die Steigung der Linie ist proportional zur Regressionssteigung, wenn Sie anstelle von lineare Regression verwendet habent tttt-Test in dieser Situation. Der Hauptvorteil eines solchen Diagramms besteht darin, dass Sie die Größe der Mittelwertdifferenz leicht beurteilen können, indem Sie die Steigung der Linie betrachten. Der Nachteil kann sein, dass dies darauf hindeutet, dass zwischen den Mitteln eine gewisse "Kontinuität" besteht (dh, Sie hatten Stichproben gepaart).

Geben Sie hier die Bildbeschreibung ein

Boxplots scheinen häufiger verwendet zu werden, da sie mehr Informationen über die Verteilung der visualisierten Variablen liefern (im Vergleich zum Mittelwert nur mit dem Konfidenzintervall). Sie ergänzen auch die Informationen aus dem Test, anstatt sie zu duplizieren, und eine solche Verwendung der Handlung wird von den meisten Styleguides empfohlen, z. B. vom Publikationshandbuch der American Psychological Association :t

Die erste Überlegung ist der Informationswert der Figur im Text des Papiers, in dem sie erscheinen soll. Wenn die Abbildung nicht wesentlich zum Verständnis des Papiers beiträgt oder andere Elemente des Papiers dupliziert, sollte sie nicht aufgenommen werden.

Tim
quelle
4
Dies ist zwar selbst in Texten, in denen T-Tests und ANOVA behandelt werden, üblich, aber dennoch eine außergewöhnliche Wahl. Das Box-Diagramm zeigt keine der Mengen, die an einem T-Test beteiligt sind, direkt an. Minimal sollte ein relevantes Diagramm die Mittelwerte zeigen und mehr Details zur Verteilung enthalten als ein Box-Diagramm. Das Detail innerhalb der Schwänze ist oft entscheidend für die Interpretation des Tests.
Nick Cox
OK @NickCox, der Datensatz wurde nur zur Visualisierung ausgewählt, aber jetzt habe ich ihn in ein passenderes Beispiel geändert.
Tim
3
Das Balkendiagramm (auch als "Dynamitdiagramm" bezeichnet) weist ein extrem hohes Verhältnis von Tinte zu Information auf.
Frank Harrell
Das Zitat aus dem APA-Handbuch (ich habe den Kontext nicht überprüft) ist ein guter allgemeiner Rat, aber an sich kein direktes Argument für die Verwendung des teilweise relevanten Boxplots in diesem Kontext. Ich stimme natürlich zu, dass Boxplots sehr nützlich und oft komplementär sein können und dass sie sehr oft verwendet werden, aber mein erster Punkt bleibt.
Nick Cox
@NickCox Ich kann nicht sagen, dass ich mit Ihnen nicht einverstanden bin, aber ich würde Boxplot trotzdem in Betracht ziehen, um zusätzliche Informationen bereitzustellen und keine T-Testergebnisse zu duplizieren, selbst wenn es nicht direkt mit T-Test zusammenhängt. Es ist einfach, klar und informativ.
Tim
8

Dies ist hauptsächlich eine Variation der hilfreichen Antworten von @Tim und @gung, aber die Grafiken können nicht in einen Kommentar eingefügt werden.

Kleine aber möglicherweise nützliche Punkte:

  1. Ein Streifendiagramm oder Punktdiagramm, wie durch @gung dargestellt, muss geändert werden, wenn Bindungen bestehen, wie in den Beispieldaten. Punkte können gestapelt oder verwackelt sein, oder wie im folgenden Beispiel können Sie ein hybrides Quantil-Box-Diagramm verwenden, wie von Emanuel Parzen vorgeschlagen (am leichtesten zugängliche Referenz ist wahrscheinlich 1979. Nichtparametrische statistische Datenmodellierung. Journal, American Statistical Association74: 105-121). Dies hat auch andere Vorteile, indem unterstrichen wird, dass sich die Hälfte der Daten innerhalb der Box befindet, die Hälfte auch außerhalb, und dass im Wesentlichen alle Details der Verteilung angezeigt werden. Wenn es, wie in diesem Zusammenhang, nur zwei Gruppen gibt, kann jede konventionellere Art von Boxplot eine minimale, tatsächlich skelettartige Darstellung sein. Einige würden das als Tugend betrachten, aber es gibt Raum, mehr Details zu zeigen. Das umgekehrte Argument ist, dass ein Box-Plot, der bestimmte Punkte kennzeichnet, insbesondere solche, die mehr als 1,5 IQR vom näheren Quartil entfernt sind, eine klare Warnung für den Benutzer darstellt: Achten Sie mit einem T-Test darauf, da möglicherweise Punkte in den Schwänzen vorhanden sind, die Sie sollten sorgen um.

  2. Sie können einem Box-Plot natürlich eine Angabe der Mittel hinzufügen, was häufig vorkommt. Das Hinzufügen eines anderen Markierungs- oder Punktsymbols ist üblich. Hier wählen wir Referenzlinien.

Geben Sie hier die Bildbeschreibung ein

Quantile-Box-Parzellen für Raucher und Nichtraucher. Die Kästchen zeigen Mediane und Quartile. Die horizontalen Linien in Blau zeigen Mittel.

Hinweis. Das Diagramm wurde in Stata erstellt. Hier ist der Code für Interessierte. stripplotmuss vorher mit installiert werden ssc inst stripplot.

clear 
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers)) 
set obs `n' 
gen smokers = smokers[1, _n] 
gen nonsmokers = nonsmokers[1, _n] 
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge) 

BEARBEITEN. Diese weitere Idee als Antwort auf die Antwort von @Frank Harrell überlagert zwei normale Wahrscheinlichkeitsdiagramme (wirklich Quantil-Quantil-Diagramme). Die horizontalen Linien zeigen Mittelwerte. Einige möchten Linien für jede Gruppe hinzufügen, die eine perfekte Anpassung anzeigen, z. B. durch ( , Mittelwert) und ( , Mittelwert SD) oder robuste, resistente Alternativen.1 +01+

Geben Sie hier die Bildbeschreibung ein

Nick Cox
quelle
1
+1, ich wollte die Daten durcheinander bringen, aber ich konnte noch nicht darauf zugreifen. Ich dachte auch darüber nach, erweiterte Diagramme hinzuzufügen, einschließlich Quantil-Box-Diagramme, Violin-Diagramme und QQ-Diagramme, aber letztendlich gab ich die Idee auf, immer mehr Diagramme aufzulisten.
Gung - Reinstate Monica
@gung Fair genug; Leider oder zum Glück könnte sich der Thread leicht in einen allgemeinen Vergleich zweier Verteilungen verwandeln. Für andere Datenbeispiele könnten Histogramme ein ernstzunehmender Konkurrent sein usw.
Nick Cox
5

Neben dem guten Ziel, die Ergebnisse zu präsentieren, sollte überlegt werden, welche Grafiken die Annahmen des Tests mit gleicher Varianz und zwei Stichproben überprüfen , um eine hervorragende Leistung zu erzielen. Das wären normale Umkehrfunktionen der beiden empirischen kumulativen Verteilungsfunktionen. Um die Testannahmen zu erfüllen, müssen diese beiden Kurven parallele gerade Linien sein.t

Frank Harrell
quelle
Ich habe meiner eigenen Antwort eine von verschiedenen Möglichkeiten hinzugefügt.
Nick Cox