Was ist zu tun, wenn einige Zeitpunkte stark verzerrte Antworten aufweisen und andere nicht in einer Studie mit wiederholten Messungen enthalten sind?

12

Wenn man in einem longitudinalen Design auf kontinuierliche, aber verzerrte Ergebnismaße stößt (z. B. mit einem Zwischensubjekteffekt), besteht der übliche Ansatz darin, das Ergebnis in Normalität umzuwandeln. Wenn die Situation extrem ist, wie beispielsweise bei abgeschnittenen Beobachtungen, kann man sich vorstellen, ein Tobit-Wachstumskurvenmodell oder ein ähnliches zu verwenden.

Aber ich bin ratlos, wenn ich Ergebnisse sehe, die zu bestimmten Zeitpunkten normal verteilt und zu anderen Zeitpunkten stark verzerrt sind. Die Transformation kann ein Leck verstopfen, aber ein anderes entfachen. Was könnten Sie in einem solchen Fall vorschlagen? Gibt es "nicht parametrische" Versionen von Modellen mit gemischten Effekten, die mir nicht bekannt sind?

Hinweis: Ein angewendetes Beispiel wären Wissenstestergebnisse vor / nach einer Reihe von pädagogischen Interventionen. Die Punktzahlen beginnen normal, häufen sich jedoch später am oberen Ende der Skala.

Brenden Dufault
quelle
6
Das Beispiel ist interessant, weil es ständig auftritt. Es gibt bekannte Transformationen, die sich damit befassen, wie Tukeys "gefaltete" Machttransformationen. Diese verändern sich in der Mitte der Skala kaum, heilen jedoch die Schiefe an beiden Enden. Ich habe festgestellt, dass gefaltete Wurzeln und Protokolle für standardisierte Vergleiche vor / nach dem Test sehr gut funktionieren .
whuber
Danke, Whuber . Ich werde auf den Ansatz der gefalteten Transformation eingehen.
Brenden Dufault
1
Eine Definition und Beispiele für Brenden finden Sie unter stats.stackexchange.com/a/10979 . Anweisungen zu ihrer Verwendung finden Sie in den letzten Kapiteln von Tukeys Buch EDA .
whuber
2
Eine zusätzliche Anmerkung - Denken Sie daran, dass Annahmen über die Residuen des Modells getroffen werden, nicht über die tatsächlich beteiligten Variablen.
Peter Flom - Reinstate Monica

Antworten:

1

Unter der Annahme, dass das Problem in Ihren Residuen auftritt (da die Verteilung der Ergebnisvariablen selbst normalerweise kein Problem darstellt), würde ich versuchen, die Ursache des Problems zu untersuchen, anstatt zu versuchen, es über eine Transformation oder Anwendung von a zu "beheben" nichtparametrisches Modell.

Wenn es den Anschein hat, dass es einen Trend gibt (z. B. allmählich mehr oder weniger normal wird) oder eine deutliche Pause zwischen dem Übergang von normal zu nicht normal, dann deutet dies auf eine Art "Regimewechsel" hin Ihre Daten (dh der Datenerzeugungsmechanismus ändert sich im Laufe der Zeit) oder eine Art fehlendes Variablenproblem.

Wenn es kein offensichtliches Muster gibt (z. B. sehen die Zeiträume 1 und 3 normal aus und die Zeiträume 2 und 4 nicht), würde ich sehr sorgfältig nach einem Datenintegritätsproblem suchen.

Eine einfache Möglichkeit, um festzustellen, ob ein Regimewechsel vorliegt, besteht darin, das Modell nur anhand der "normalen" Zeiträume zu schätzen und dann anhand der anderen Zeiträume neu zu schätzen und festzustellen, welcher Unterschied auftritt. Ein komplizierterer Ansatz ist die Verwendung eines latenten Klassenmodells, möglicherweise mit der Zeit als begleitende Variable.

Was Ihre Frage zu nichtparametrischen Mixed-Effects-Modellen betrifft, hängt dies davon ab, was Sie unter nichtparametrisch verstehen. Wenn Sie Modelle meinen, die keine numerisch abhängige Variable annehmen, gibt es viele solcher Modelle (z. B. hat LIMDEP einige). Bedenken Sie auch, dass die Verletzung der Normalitätsannahme aus Inferenzsicht wahrscheinlich nur dann problematisch ist, wenn Ihre Stichprobengröße klein ist. Eine Möglichkeit, dies zu untersuchen, besteht darin, die verschiedenen Transformationen, die in anderen Kommentaren und Antworten erörtert wurden, auszuprobieren und zu prüfen, ob sie einen großen Einfluss auf Ihre Schlussfolgerungen haben.

Tim
quelle
+1 Danke, Tim. Ich freue mich über Ihre Vorschläge zu Latent Class Models und LIMDEP. Diese Ansätze werden immer attraktiver für mich, wenn ich mehr über sie erfahre.
Brenden Dufault
0

Es gibt die Box-Cox-Transformationen, die die Variable auf ein Leistungs-Lambda anheben, wobei Lambda in die Modellparameterschätzung einbezogen wird. Ich bin mit Tukeys gefalteter Kraftumwandlung nicht vertraut, daher weiß ich nicht, ob wir über dasselbe reden. Um Lambda zu schätzen, benötigen Sie mehrere Punkte in der Passung. Möchten Sie zu jedem Zeitpunkt eine andere Verteilung anpassen, bei der die Verteilung für eine Gruppe von Probanden definiert ist, die den Test zu jedem Zeitpunkt durchführen? Selbst wenn dies der Fall ist, wenn Sie wissen, dass einige Zeitpunkte dieselbe Verteilung haben sollten, möchten Sie sie möglicherweise in einer einzigen Anpassung kombinieren.

Ein anderer Ansatz, der nicht parametrisch ist und keine Transformationen in die Normalität beinhaltet, wäre das Anwenden des Bootstraps zu jedem Zeitpunkt oder zu jedem kombinierten Satz von Zeitpunkten.

Michael R. Chernick
quelle