Kann ich einen gepaarten T-Test verwenden, wenn die Proben normal verteilt sind, der Unterschied jedoch nicht?

12

Ich habe Daten aus einem Experiment, bei dem ich zwei verschiedene Behandlungen unter identischen Anfangsbedingungen angewendet habe und als Ergebnis eine ganze Zahl zwischen 0 und 500 erzeugt habe. Ich möchte einen gepaarten T-Test verwenden, um festzustellen, ob die durch die beiden Behandlungen hervorgerufenen Wirkungen signifikant unterschiedlich sind. Die Ergebnisse für jede Behandlungsgruppe sind normal verteilt, aber der Unterschied zwischen jedem Paar ist nicht normal verteilt (asymmetrisch + ein langer Schwanz).

Kann ich in diesem Fall einen gepaarten t-Test verwenden oder wird die Annahme der Normalität verletzt, was bedeutet, dass ich einen nicht parametrischen Test verwenden sollte?

John Doucette
quelle
Das Experiment basiert auf einer Simulation. Ich kann die Anfangsbedingungen der Simulation nach Belieben einstellen. Daher beginne ich für jedes Paar mit denselben Anfangsbedingungen und wende zwei verschiedene Algorithmen an.
John Doucette
Nach dem, was Sie beschreiben, klingt dies wie eine unabhängige Gruppe. Haben Sie beide Behandlungen auf jeden Fall angewendet oder gibt es eine andere Übereinstimmung? Was ist die Korrelation zwischen den Bedingungen? Dein Wortlaut ist seltsam ... meinst du, du hast einen Wert im Schwanz, der ihn asymmetrisch macht?
John
Wenn ich weiter darüber nachdenke, bin ich mir weniger sicher, dass sie abhängig sind, aber vielleicht können Sie etwas Licht ins Dunkel bringen. Die analoge Korrelation in der realen Welt wäre: Ich habe eine Person. Behandlung eins wird verabreicht und eine Messung wird durchgeführt. Dann rolle ich die Zeit zurück und verabreiche stattdessen die zweite Behandlung. Eine Messung wird erneut durchgeführt. Es scheint mir, dass diese Maßnahmen als korreliert angesehen werden sollten. Vielleicht sollten sie nicht?
John Doucette
Mit der Nicht-Normalität ist die Verteilung sowohl asymmetrisch als auch hat einen langen Schwanz (mit mehreren Ausreißern). Das Entfernen einiger Ausreißer würde es nicht normal machen.
John Doucette
3
Wenn die univariaten Verteilungen normal und unabhängig sind, muss die Verteilung der Unterschiede normal sein. Sein Mangel an Normalität zeigt eine Abhängigkeit zwischen den beiden Verteilungen. Die Abhängigkeit ist nicht nur die der Korrelation: Es muss auch noch etwas anderes passieren.
whuber

Antworten:

13

Ein gepaarter t-Test analysiert nur die Liste der gepaarten Unterschiede und geht davon aus, dass eine Stichprobe von Werten zufällig aus einer Gaußschen Population entnommen wird. Wenn diese Annahme grob verletzt wird, ist der gepaarte t-Test nicht gültig. Die Verteilung, aus der die Vorher- und Nachher-Werte Stichproben sind, spielt keine Rolle - nur die Grundgesamtheit, aus der die Unterschiede stammen, wird aus der Materie entnommen.

Harvey Motulsky
quelle
Nehmen wir also an, ich habe ein nichtlineares Modell analysiert und y_observed at time = i generiert. Kann ich einen gepaarten t-Test durchführen, der jeden beobachteten mit dem tatsächlichen Wert zum Zeitpunkt i vergleicht? Nehmen wir auch an, ich habe die beobachteten Daten für 100 Zeitintervalle und prognostiziere meine Zahlen in denselben Intervallen
dassouki