Mit Amelia in R erhielt ich mehrere unterstellte Datensätze. Danach führte ich einen Test mit wiederholten Messungen in SPSS durch. Jetzt möchte ich die Testergebnisse bündeln. Ich weiß, dass ich Rubins Regeln (implementiert durch ein beliebiges Paket mit mehreren Imputationen in R) verwenden kann, um Mittelwerte und Standardfehler zu bündeln, aber wie bündle ich p-Werte? Ist es möglich? Gibt es eine Funktion in R, um dies zu tun? Danke im Voraus.
11
Antworten:
Ja , das ist möglich und es gibt
R
Funktionen, die dies tun. Anstatt die p-Werte der wiederholten Analysen von Hand zu berechnen, können Sie das Paket verwendenZelig
, auf das auch in der Vignette des Pakets verwiesen wirdAmelia
( eine informativere Methode finden Sie in meinem Update unten ). Ich werde ein Beispiel aus derAmelia
-vignette verwenden, um dies zu demonstrieren:Dies ist die entsprechende Ausgabe einschließlich Werten:p
zelig
kann eine Vielzahl anderer Modelle als die kleinsten Quadrate aufnehmen.Um Konfidenzintervalle und Freiheitsgrade für Ihre Schätzungen zu erhalten, können Sie Folgendes verwenden
mitools
:Dies gibt Ihnen Konfidenzintervalle und einen Anteil der Gesamtvarianz, der auf die fehlenden Daten zurückzuführen ist:
Natürlich können Sie die interessanten Ergebnisse einfach in einem Objekt kombinieren:
Aktualisieren
Nach einigem Herumspielen habe ich einen flexibleren Weg gefunden, um alle notwendigen Informationen mit dem
mice
-Paket zu erhalten. Damit dies funktioniert, müssen Sie die Funktion des Pakets ändernas.mids()
. Verwenden Sie Gerkos Version, die in meiner Folgefrage veröffentlicht wurde :Wenn dies definiert ist, können Sie die unterstellten Datensätze analysieren:
Dadurch erhalten Sie alle Ergebnisse , die Sie erhalten mit
Zelig
undmitools
und mehr:pool()
method
quelle
mice.res <- summary(pool(mice.fit, method = "rubin1987"))
.Normalerweise würden Sie den p-Wert nehmen, indem Sie Rubins Regeln auf herkömmliche statistische Parameter wie Regressionsgewichte anwenden. Daher besteht häufig keine Notwendigkeit, p-Werte direkt zu bündeln. Außerdem kann die Likelihood-Ratio-Statistik zusammengefasst werden, um Modelle zu vergleichen. Pooling-Verfahren für andere Statistiken finden Sie in meinem Buch Flexible Imputation fehlender Daten, Kapitel 6.
In Fällen, in denen keine Verteilung oder Methode bekannt ist, gibt es ein unveröffentlichtes Verfahren von Licht und Rubin für einseitige Tests. Ich habe dieses Verfahren verwendet, um p-Werte aus dem
wilcoxon()
Verfahren zusammenzufassen, aber es ist allgemein und unkompliziert, sich an andere Verwendungen anzupassen.Verwenden Sie das unten stehende Verfahren NUR, wenn alles andere fehlschlägt. Derzeit wissen wir wenig über die statistischen Eigenschaften.
quelle
pool()
Funktion in Ihrem Paket (die übrigens hervorragend ist ) zum gepoolten p-Wert?