Ich verwende derzeit ein Modell mit mehreren Regressionen unter Verwendung von unterstellten Daten und habe einige Fragen.
Hintergrund:
Verwenden von SPSS 18. Meine Daten scheinen MAR zu sein. Durch das listweise Löschen von Fällen habe ich nur 92 Fälle, durch mehrfache Imputation bleiben 153 Fälle zur Analyse übrig. Alle Annahmen erfüllt - ein variables Protokoll transformiert. 9 IV 5 - 5 kategorisch, 3 Skala, 1 Intervall. DV-Skala. Verwenden der Enter-Methode der standardmäßigen multiplen Regression.
- Mein DV ist die Differenz der Punktzahlen zwischen einem Pre-Score- und einem Post-Score-Maß. Bei diesen beiden Variablen fehlt eine Reihe von Fällen. Sollte ich für jeden dieser Werte fehlende Werte unterstellen und dann den Unterschied zwischen ihnen berechnen, um meinen DV zu berechnen (Wie mache ich das) oder kann ich einfach Daten für meinen DV unterstellen? Welches ist der am besten geeignete Ansatz?
- Sollte ich Imputationen für transformierte Daten oder verzerrte nicht transformierte Daten durchführen?
- Sollte ich alle Variablen in den Imputationsprozess eingeben, auch wenn ihnen keine Daten fehlen, oder sollte ich nur Daten für die Variablen unterstellen, bei denen mehr als 10% der Fälle fehlen?
Ich habe die Regression für die listweise gelöschten Fälle ausgeführt und mein IV-Konto hat nur einen sehr geringen Anteil an der Varianz in meinem DV. Anschließend habe ich die Regression für eine vollständige Datei nach mehrfacher Imputation ausgeführt. Die Ergebnisse sind sehr ähnlich, da meine 9 IVs immer noch vorhanden sind prognostizieren nur ca. 12% der Varianz in meinem DV, aber jetzt zeigt einer meiner IVs an, dass er einen signifikanten Beitrag leistet (dies ist zufällig eine logarithmisch transformierte Variable) ...
- Sollte ich Originaldaten melden, wenn es kaum einen Unterschied zwischen meinen Schlussfolgerungen gibt - dh meine IVs sagen den dv schlecht voraus oder die vollständigen Daten melden?
R^2
auftritt). Sehen Sie hier eine nette Diskussion über Pre-Post-Designs . Obwohl das Ihre Frage immer noch nicht beantwortet!Antworten:
Verweise
Edwards, JR (1994). Regressionsanalyse als Alternative zu Differenzwerten. Journal of Management , 20 , 683 & ndash; 689.
Enders, CK (2010). Angewandte Analyse fehlender Daten . New York, NY: Guilford Press.
quelle
Nach meiner Erfahrung ist die Imputationsfunktion von SPSS einfach zu verwenden, sowohl beim Erstellen von Datensätzen als auch beim Analysieren und Zusammenführen der resultierenden Imputationsdatensätze. Die Benutzerfreundlichkeit ist jedoch auch der Nachteil. Wenn Sie sich eine ähnliche Imputationsfunktion in der
R
Statistiksoftware ansehen (siehe zum Beispiel dasmice
Paket), sehen Sie weitaus mehr Optionen. Auf der Website von Stef van Buurens finden Sie eine hervorragende Erklärung für die multiple Imputation im Allgemeinen (mit oder ohne Verwendung des Mäusepakets).Es ist sehr wichtig zu beachten, dass diese zusätzlichen Optionen nicht nur für fortgeschrittene Benutzer eine Luxusoption darstellen . Einige sind wichtig, um eine ordnungsgemäße Kongenialität zu erreichen , bestimmte Modelle für bestimmte fehlende Variablen , bestimmte Prädiktoren für bestimmte fehlende Variablen , Imputationsdiagnose und mehr, die in der SPSS-Imputationsfunktion nicht verfügbar sind.
Zu Ihren Fragen:
quelle