Wenn man in einem longitudinalen Design auf kontinuierliche, aber verzerrte Ergebnismaße stößt (z. B. mit einem Zwischensubjekteffekt), besteht der übliche Ansatz darin, das Ergebnis in Normalität umzuwandeln. Wenn die Situation extrem ist, wie beispielsweise bei abgeschnittenen Beobachtungen, kann man sich vorstellen, ein Tobit-Wachstumskurvenmodell oder ein ähnliches zu verwenden.
Aber ich bin ratlos, wenn ich Ergebnisse sehe, die zu bestimmten Zeitpunkten normal verteilt und zu anderen Zeitpunkten stark verzerrt sind. Die Transformation kann ein Leck verstopfen, aber ein anderes entfachen. Was könnten Sie in einem solchen Fall vorschlagen? Gibt es "nicht parametrische" Versionen von Modellen mit gemischten Effekten, die mir nicht bekannt sind?
Hinweis: Ein angewendetes Beispiel wären Wissenstestergebnisse vor / nach einer Reihe von pädagogischen Interventionen. Die Punktzahlen beginnen normal, häufen sich jedoch später am oberen Ende der Skala.
quelle
Antworten:
Unter der Annahme, dass das Problem in Ihren Residuen auftritt (da die Verteilung der Ergebnisvariablen selbst normalerweise kein Problem darstellt), würde ich versuchen, die Ursache des Problems zu untersuchen, anstatt zu versuchen, es über eine Transformation oder Anwendung von a zu "beheben" nichtparametrisches Modell.
Wenn es den Anschein hat, dass es einen Trend gibt (z. B. allmählich mehr oder weniger normal wird) oder eine deutliche Pause zwischen dem Übergang von normal zu nicht normal, dann deutet dies auf eine Art "Regimewechsel" hin Ihre Daten (dh der Datenerzeugungsmechanismus ändert sich im Laufe der Zeit) oder eine Art fehlendes Variablenproblem.
Wenn es kein offensichtliches Muster gibt (z. B. sehen die Zeiträume 1 und 3 normal aus und die Zeiträume 2 und 4 nicht), würde ich sehr sorgfältig nach einem Datenintegritätsproblem suchen.
Eine einfache Möglichkeit, um festzustellen, ob ein Regimewechsel vorliegt, besteht darin, das Modell nur anhand der "normalen" Zeiträume zu schätzen und dann anhand der anderen Zeiträume neu zu schätzen und festzustellen, welcher Unterschied auftritt. Ein komplizierterer Ansatz ist die Verwendung eines latenten Klassenmodells, möglicherweise mit der Zeit als begleitende Variable.
Was Ihre Frage zu nichtparametrischen Mixed-Effects-Modellen betrifft, hängt dies davon ab, was Sie unter nichtparametrisch verstehen. Wenn Sie Modelle meinen, die keine numerisch abhängige Variable annehmen, gibt es viele solcher Modelle (z. B. hat LIMDEP einige). Bedenken Sie auch, dass die Verletzung der Normalitätsannahme aus Inferenzsicht wahrscheinlich nur dann problematisch ist, wenn Ihre Stichprobengröße klein ist. Eine Möglichkeit, dies zu untersuchen, besteht darin, die verschiedenen Transformationen, die in anderen Kommentaren und Antworten erörtert wurden, auszuprobieren und zu prüfen, ob sie einen großen Einfluss auf Ihre Schlussfolgerungen haben.
quelle
Es gibt die Box-Cox-Transformationen, die die Variable auf ein Leistungs-Lambda anheben, wobei Lambda in die Modellparameterschätzung einbezogen wird. Ich bin mit Tukeys gefalteter Kraftumwandlung nicht vertraut, daher weiß ich nicht, ob wir über dasselbe reden. Um Lambda zu schätzen, benötigen Sie mehrere Punkte in der Passung. Möchten Sie zu jedem Zeitpunkt eine andere Verteilung anpassen, bei der die Verteilung für eine Gruppe von Probanden definiert ist, die den Test zu jedem Zeitpunkt durchführen? Selbst wenn dies der Fall ist, wenn Sie wissen, dass einige Zeitpunkte dieselbe Verteilung haben sollten, möchten Sie sie möglicherweise in einer einzigen Anpassung kombinieren.
Ein anderer Ansatz, der nicht parametrisch ist und keine Transformationen in die Normalität beinhaltet, wäre das Anwenden des Bootstraps zu jedem Zeitpunkt oder zu jedem kombinierten Satz von Zeitpunkten.
quelle