Ich frage mich, wie eingeschränkte kubische Splines (wie im Effektivwertpaket) in die Imputationsmodelle innerhalb des Imputationspakets für R-Mäuse integriert werden können.
Kontext : Ich mache biomedizinische Forschung und habe Zugang zu einem Datensatz, der aus Patienteneigenschaften und Daten über das Fortschreiten der Krankheit des Patienten besteht, neben den Ergebnissen nach der medizinischen Versorgung (z. B. ein Jahr Überleben). Ziel ist es, ein Vorhersagemodell zu erstellen, das auf den Patienteneigenschaften und dem Krankheitsverlauf basiert, um das Auftreten bestimmter Ergebnisse vorherzusagen. Leider haben einige Patienten nicht alle Informationen zu allen Variablen. Aus diesem Grund habe ich beschlossen, mehrere Imputationstechniken zu verwenden, um (mehrfach) abzuschätzen, wie hoch diese fehlenden Werte sein würden.
Problem : Bei Verwendung der Mehrfachimputation gibt es diese "Regel", die als Kongenialität bezeichnet wird. Dies bedeutet, dass für die Imputation das für die endgültige Analyse verwendete statistische Modell (dh das Vorhersagemodell, das ich untersuchen möchte) ebenfalls in das Imputationsmodell aufgenommen werden muss (vorzugsweise mit zusätzlichen Informationen). Dies bedeutet auch, mögliche nichtlineare Assoziationen zu berücksichtigen. Da ich nicht weiß, ob bestimmte Prädiktoren nichtlineare Assoziationen mit anderen haben, möchte ich, dass die Imputationsmodelle eingeschränkte kubische Splines anpassen können. Ich verstehe jedoch nicht wirklich, wie man das bei Mäusen macht. Ich möchte daher Hilfe bei der Erstellung von Imputationsmodellen für rcs, die für Mäuse geeignet sind.
Nebenbemerkung an alle Moderatoren: Ich dachte, diese Frage sei für Crossvalidated geeignet, da Imputation und Splines spezifische „statistische“ Themen sind. Aufgrund des Fokus auf den Programmiercharakter dieser "How to" -Frage würde es mir jedoch nichts ausmachen, wenn die Frage migriert wird, wenn Sie der Meinung sind, dass sie an anderer Stelle besser geeignet ist. Nach diesem Zweifel habe ich diese Frage auch auf StackOverflow gepostet ( /programming/45674088/how-to-use-restricted-cubic-splines-with-the-r-mice-imputation-package ).
Antworten:
Sie haben Recht, dass das Imputationsmodell genauso umfangreich oder umfangreicher sein muss als das Ergebnismodell. Die Tatsache, dass die Imputation auf der Grundlage der vollständigen Maximum-Likelihood-Schätzung und der Imputation durch
mice
Annahme der Linearität überall erfolgt, war ein Hauptgrund, warum ich die R-Hmisc
Paketfunktion geschrieben habearegImpute
, mit der Imputationsmodelle automatisch unter Verwendung von reichhaltigen additiven beschränkten kubischen Spline-Modellen erstellt werden. Daher wird für die Mehrfachzuschreibung keine Linearität angenommen. Der Standardansatz inaregImpute
ist Predictive Mean Matching, den ich im Allgemeinen gegenüber parametrischeren Ansätzen bevorzuge (Splines werden immer noch verwendet; PMM ist auf der linken Seite von Modellen weniger parametrisch).Wie
mice
,aregImpute
verwendet verketteten Gleichungen. Im Gegensatzmice
dazu werden Bootstrap-Draws anstelle von ungefähren (unter der Annahme einer multivariaten Normalität) Bayes'schen posterioren Draws verwendet.quelle
mice
Verwendung von Nullknoten (Linearität)), der ein netter Teil eines R-Pakets wäre. Während Sie dies tun, können Sie vergleichenmice
undaregImpute
codieren, um festzustellen, womice
es etwas langsam ist und was beschleunigt werden könnte.