Ich möchte Ratschläge zum Zusammenfassen der Kalibrierungsdiagramme / -statistiken nach mehrfacher Imputation. Bei der Entwicklung statistischer Modelle zur Vorhersage eines zukünftigen Ereignisses (z. B. Verwendung von Daten aus Krankenhausakten zur Vorhersage des Überlebens oder von Ereignissen nach der Entlassung aus dem Krankenhaus) kann man sich vorstellen, dass einige zu viele Informationen fehlen. Multiple Imputation ist eine Möglichkeit, mit einer solchen Situation umzugehen, führt jedoch dazu, dass die Teststatistiken aus jedem Imputationsdatensatz unter Berücksichtigung der zusätzlichen Variabilität aufgrund der inhärenten Unsicherheit der Imputation zusammengefasst werden müssen.
Ich verstehe, dass es mehrere Kalibrierungsstatistiken gibt (Hosmer-Lemeshow, Harrell's Emax, geschätzter Kalibrierungsindex usw.), für die die "normalen" Rubins-Regeln für das Pooling gelten könnten.
Bei diesen Statistiken handelt es sich jedoch häufig um allgemeine Kalibrierungsmaße, bei denen keine spezifischen fehlkalibrierten Bereiche des Modells angezeigt werden. Aus diesem Grund schaue ich mir lieber ein Kalibrierungsdiagramm an. Leider habe ich keine Ahnung, wie ich die Diagramme oder die Daten dahinter "bündeln" soll (vorhergesagte Wahrscheinlichkeiten pro Person und beobachteter Ausgang pro Person), und kann in der biomedizinischen Literatur (dem mir bekannten Gebiet) nicht viel finden. oder hier bei CrossValidated. Ein Blick auf das Kalibrierungsdiagramm jedes Imputationsdatensatzes könnte natürlich eine Antwort sein, aber bei der Erstellung einer Vielzahl von Imputationssätzen (derzeit) ziemlich lästig werden.
Ich möchte daher fragen, ob es Techniken gibt, die zu einem Kalibrierungsdiagramm führen, das nach mehrfacher Imputation zusammengefasst wird (?)
Antworten:
Zu Referenzen:
quelle