Was sind die am meisten akzeptierten Möglichkeiten, um die Ergebnisse eines unabhängigen T-Tests mit zwei Stichproben zu visualisieren? Wird eine numerische Tabelle häufiger verwendet oder eine Art Diagramm? Das Ziel ist, dass ein gelegentlicher Beobachter die Figur betrachtet und sofort erkennt, dass sie wahrscheinlich aus zwei verschiedenen Bevölkerungsgruppen stammen.
data-visualization
t-test
backen
quelle
quelle
Antworten:
Es lohnt sich, über den Zweck Ihrer Handlung klar zu sein. Im Allgemeinen gibt es zwei verschiedene Arten von Zielen: Sie können Diagramme für sich selbst erstellen, um die von Ihnen getroffenen Annahmen zu bewerten und den Datenanalyseprozess zu steuern, oder Sie können Diagramme erstellen, um anderen ein Ergebnis mitzuteilen. Diese sind nicht gleich; Beispielsweise können viele Betrachter / Leser Ihrer Handlung / Analyse statistisch nicht anspruchsvoll sein und sind möglicherweise nicht mit der Idee der beispielsweise gleichen Varianz und ihrer Rolle in einem T-Test vertraut. Sie möchten, dass Ihr Grundstück die wichtigen Informationen über Ihre Daten auch Verbrauchern wie diesen vermittelt. Sie vertrauen implizit darauf, dass Sie die Dinge richtig gemacht haben. Aus Ihrem Fragen-Setup geht hervor, dass Sie nach dem letzteren Typ suchen.
Realistisch gesehen ist das häufigste und am meisten akzeptierte Diagramm zur Übermittlung der Ergebnisse eines T-Tests 1 an andere (abgesehen davon, ob es tatsächlich am besten geeignet ist) ein Balkendiagramm mit Mitteln mit Standardfehlerbalken. Dies passt sehr gut zum t-Test, da ein t-Test zwei Mittelwerte anhand ihrer Standardfehler vergleicht. Wenn Sie zwei unabhängige Gruppen haben, erhalten Sie ein Bild, das selbst für statistisch nicht anspruchsvolle Personen intuitiv ist, und (datenwillige) Personen können "sofort erkennen, dass sie wahrscheinlich aus zwei verschiedenen Bevölkerungsgruppen stammen". Hier ist ein einfaches Beispiel unter Verwendung der Daten von @ Tim:
Allerdings verachten Datenvisualisierungsspezialisten diese Diagramme normalerweise. Sie werden oft als "Dynamitplots" verspottet (vgl. Warum Dynamitplots schlecht sind ). Insbesondere wenn Sie nur wenige Daten haben, wird häufig empfohlen, die Daten einfach selbst anzuzeigen . Wenn sich die Punkte überlappen, können Sie sie horizontal zittern lassen (ein wenig zufälliges Rauschen hinzufügen), damit sie sich nicht mehr überlappen. Da es bei einem T-Test im Wesentlichen um Mittelwerte und Standardfehler geht, ist es am besten, die Mittelwerte und Standardfehler auf ein solches Diagramm zu legen. Hier ist eine andere Version:
Wenn Sie viele Daten haben, sind Boxplots möglicherweise die bessere Wahl, um einen schnellen Überblick über die Verteilungen zu erhalten, und Sie können dort auch die Mittelwerte und SEs überlagern.
Einfache Darstellungen der Daten und Boxplots sind so einfach, dass die meisten Menschen sie verstehen können, auch wenn sie statistisch nicht sehr versiert sind. Bedenken Sie jedoch, dass keines davon die Beurteilung der Gültigkeit eines T-Tests zum Vergleich Ihrer Gruppen erleichtert. Diese Ziele werden am besten durch verschiedene Arten von Handlungen erreicht.
1. Beachten Sie, dass diese Diskussion einen unabhängigen Stichproben-T-Test voraussetzt. Diese Diagramme könnten mit einem T-Test für abhängige Stichproben verwendet werden, könnten aber auch in diesem Zusammenhang irreführend sein (vgl. Ist die Verwendung von Fehlerbalken für Mittelwerte in einer Studie innerhalb der Probanden falsch? ).
quelle
Die am häufigsten verwendete Methode zur Visualisierung des Test-ähnlichen Vergleichs ist die Verwendung von Boxplots . Im Folgenden gebe ich ein Beispiel mit einem Datensatz, der die "Beziehung zwischen dem Rauchen von Marihuana und einem Leistungsdefizit bei einer Aufgabe zur Messung des Kurzzeitgedächtnisses" auf dieser Website beschreibt .t
Tatsächlich werden Boxplots üblicherweise für "informelle" Hypothesentests verwendet, beispielsweise wie von Yoav Benjamini in der 1988 erschienenen Veröffentlichung " Opening the Box of a Boxplot" beschrieben :
Siehe auch: T-Test, bei dem nur zusammenfassende Daten in einem Box-Plot verwendet werden
Dieses Diagramm zeigt keine Mengen, die direkt am Test beteiligt sind , wie @NickCox bemerkt hat. Wenn Sie Mittelwerte direkt mit Konfidenzintervallen vergleichen möchten, können Sie ein Balkendiagramm mit markierten Konfidenzintervallen verwenden. Mit Hilfe von Mitteln und Konfidenzintervallen können Sie auch einen Hypothesentest durchführen (siehe hier oder hier ).t
Wie Sie anderen Beiträgen und Kommentaren in diesem Thread entnehmen können, sind sowohl Boxplots als auch Dynamitplots eine etwas kontroverse Wahl. Lassen Sie mich Ihnen eine weitere Alternative geben, die noch nicht erwähnt wurde. Denken Sie zunächst daran, dass Test und Regression zusammenhängen . Sie können einen Test-ähnlichen Vergleich als zwei Punkte mit Fehlerbalken (Konfidenzintervallen) darstellen, die mit der Linie verbunden sind. Die Steigung der Linie ist proportional zur Regressionssteigung, wenn Sie anstelle von lineare Regression verwendet habent tt t t -Test in dieser Situation. Der Hauptvorteil eines solchen Diagramms besteht darin, dass Sie die Größe der Mittelwertdifferenz leicht beurteilen können, indem Sie die Steigung der Linie betrachten. Der Nachteil kann sein, dass dies darauf hindeutet, dass zwischen den Mitteln eine gewisse "Kontinuität" besteht (dh, Sie hatten Stichproben gepaart).
Boxplots scheinen häufiger verwendet zu werden, da sie mehr Informationen über die Verteilung der visualisierten Variablen liefern (im Vergleich zum Mittelwert nur mit dem Konfidenzintervall). Sie ergänzen auch die Informationen aus dem Test, anstatt sie zu duplizieren, und eine solche Verwendung der Handlung wird von den meisten Styleguides empfohlen, z. B. vom Publikationshandbuch der American Psychological Association :t
quelle
Dies ist hauptsächlich eine Variation der hilfreichen Antworten von @Tim und @gung, aber die Grafiken können nicht in einen Kommentar eingefügt werden.
Kleine aber möglicherweise nützliche Punkte:
Ein Streifendiagramm oder Punktdiagramm, wie durch @gung dargestellt, muss geändert werden, wenn Bindungen bestehen, wie in den Beispieldaten. Punkte können gestapelt oder verwackelt sein, oder wie im folgenden Beispiel können Sie ein hybrides Quantil-Box-Diagramm verwenden, wie von Emanuel Parzen vorgeschlagen (am leichtesten zugängliche Referenz ist wahrscheinlich 1979. Nichtparametrische statistische Datenmodellierung. Journal, American Statistical Association74: 105-121). Dies hat auch andere Vorteile, indem unterstrichen wird, dass sich die Hälfte der Daten innerhalb der Box befindet, die Hälfte auch außerhalb, und dass im Wesentlichen alle Details der Verteilung angezeigt werden. Wenn es, wie in diesem Zusammenhang, nur zwei Gruppen gibt, kann jede konventionellere Art von Boxplot eine minimale, tatsächlich skelettartige Darstellung sein. Einige würden das als Tugend betrachten, aber es gibt Raum, mehr Details zu zeigen. Das umgekehrte Argument ist, dass ein Box-Plot, der bestimmte Punkte kennzeichnet, insbesondere solche, die mehr als 1,5 IQR vom näheren Quartil entfernt sind, eine klare Warnung für den Benutzer darstellt: Achten Sie mit einem T-Test darauf, da möglicherweise Punkte in den Schwänzen vorhanden sind, die Sie sollten sorgen um.
Sie können einem Box-Plot natürlich eine Angabe der Mittel hinzufügen, was häufig vorkommt. Das Hinzufügen eines anderen Markierungs- oder Punktsymbols ist üblich. Hier wählen wir Referenzlinien.
Quantile-Box-Parzellen für Raucher und Nichtraucher. Die Kästchen zeigen Mediane und Quartile. Die horizontalen Linien in Blau zeigen Mittel.
Hinweis. Das Diagramm wurde in Stata erstellt. Hier ist der Code für Interessierte.
stripplot
muss vorher mit installiert werdenssc inst stripplot
.BEARBEITEN. Diese weitere Idee als Antwort auf die Antwort von @Frank Harrell überlagert zwei normale Wahrscheinlichkeitsdiagramme (wirklich Quantil-Quantil-Diagramme). Die horizontalen Linien zeigen Mittelwerte. Einige möchten Linien für jede Gruppe hinzufügen, die eine perfekte Anpassung anzeigen, z. B. durch ( , Mittelwert) und ( , Mittelwert SD) oder robuste, resistente Alternativen.1 +0 1 +
quelle
Neben dem guten Ziel, die Ergebnisse zu präsentieren, sollte überlegt werden, welche Grafiken die Annahmen des Tests mit gleicher Varianz und zwei Stichproben überprüfen , um eine hervorragende Leistung zu erzielen. Das wären normale Umkehrfunktionen der beiden empirischen kumulativen Verteilungsfunktionen. Um die Testannahmen zu erfüllen, müssen diese beiden Kurven parallele gerade Linien sein.t
quelle