Ich habe mehrere Imputationen verwendet, um eine Reihe vollständiger Datensätze zu erhalten.
Ich habe bei jedem der vervollständigten Datensätze Bayes'sche Methoden verwendet, um die posterioren Verteilungen für einen Parameter zu erhalten (ein zufälliger Effekt).
Wie kann ich die Ergebnisse für diesen Parameter kombinieren / bündeln?
Mehr Kontext:
Mein Modell ist hierarchisch im Sinne von einzelnen Schülern (eine Beobachtung pro Schüler), die in Schulen zusammengefasst sind. Ich habe mehrere Imputationen (unter Verwendung von MICE
in R) für meine Daten durchgeführt, wobei ich school
als einen der Prädiktoren für die fehlenden Daten angegeben habe, um zu versuchen, die Datenhierarchie in die Imputationen einzubeziehen.
Ich habe jedem der vervollständigten Datensätze ein einfaches Modell mit zufälliger Steigung hinzugefügt (unter Verwendung MCMCglmm
von R). Das Ergebnis ist binär.
Ich habe festgestellt, dass die hinteren Dichten der zufälligen Steigungsvarianz in dem Sinne "gut benommen" sind, dass sie ungefähr so aussehen:
Wie kann ich die posterioren Mittelwerte und glaubwürdigen Intervalle aus jedem unterstellten Datensatz für diesen zufälligen Effekt kombinieren / bündeln?
Update1 :
Soweit ich weiß, könnte ich Rubins Regeln auf den posterioren Mittelwert anwenden, um einen multiplizierten posterioren Mittelwert zu erhalten - gibt es dabei irgendwelche Probleme? Aber ich habe keine Ahnung, wie ich die zu 95% glaubwürdigen Intervalle kombinieren kann. Könnte ich diese auch irgendwie kombinieren, da ich für jede Imputation eine tatsächliche Probe mit posteriorer Dichte habe?
Update2 :
Gemäß dem Vorschlag von @ cyan in den Kommentaren gefällt mir die Idee sehr, einfach die Stichproben aus den posterioren Verteilungen zu kombinieren, die aus jedem vollständigen Datensatz aus multipler Imputation erhalten wurden. Ich möchte jedoch die theoretische Begründung dafür kennen.
quelle
Antworten:
Mit besonders gut erzogenen Postern, die durch eine parametrische Beschreibung einer Verteilung angemessen beschrieben werden können, können Sie möglicherweise einfach den Mittelwert und die Varianz nehmen, die Ihren Postern am besten beschreiben, und von dort aus fortfahren. Ich vermute, dass dies in vielen Fällen angemessen ist, in denen Sie keine wirklich merkwürdigen hinteren Verteilungen erhalten.
quelle
Wenn Sie stata verwenden, gibt es eine Prozedur namens "mim", mit der die Daten nach der Imputation für Modelle mit gemischten Effekten zusammengefasst werden. Ich weiß nicht, ob es in R verfügbar ist.
quelle