Gibt es eine Grenze, die bei Verwendung der Mehrfachimputation (MI) am wenigsten akzeptabel ist?
Kann ich beispielsweise MI verwenden, wenn die fehlenden Werte in einer Variablen 20% der Fälle ausmachen, während andere Variablen fehlende Werte aufweisen, jedoch nicht auf einem so hohen Niveau?
Antworten:
Aus den Kommentaren geht hervor, dass Sie sich in einer MAR- oder MCAR-Situation befinden. Dann ist eine mehrfache Imputation zumindest sinnvoll. Wie viel Fehlen ist also nachvollziehbar? Denk darüber so:
Grundsätzlich macht die Mehrfachimputation alle Ihre Modellparameterschätzungen in Abhängigkeit von der Genauigkeit, mit der die fehlenden Daten mit Ihrem Imputationsmodell vorhergesagt werden können, weniger sicher. Dies hängt unter anderem von der Menge der fehlenden Imputationen ab, die berechnet werden müssen Anzahl der von Ihnen verwendeten Imputationen.
Anstatt hier die Definitionen fehlender Informationen usw. zu generieren, können Sie einfach die MI-FAQ lesen, die die Dinge sehr klar formuliert. Von dort wissen Sie, ob Sie die Originalquellen in Angriff nehmen möchten: Rubin usw.
In der Praxis sollten Sie wahrscheinlich nur eine Imputationsanalyse durchführen und sehen, wie sie funktioniert.
quelle
Sie könnten finden
hilfreich.
quelle