Kennt jemand eine Implementierung (außer dem SAS-Makro) der doppelt robusten Schätzmethode in:
Funk, MJ, Westreich, D. et al. (2011). Doppelt robuste Abschätzung der kausalen Auswirkungen. American Journal of Epidemiology, 173 (7): 761 & ndash; 767. [DOI] ?
regression
ADB
quelle
quelle
Antworten:
Eine doppelt robuste Schätzung ist in der Sprache Ihrer Wahl nicht besonders schwer zu implementieren. Alles, was Sie tatsächlich tun, ist die Steuerung von Variablen auf zwei Arten und nicht auf eine. Die Idee ist, dass Sie erfolgreich auf Verwechslungen kontrolliert haben, solange eines der beiden zur Steuerung verwendeten Modelle korrekt ist.
Meiner Meinung nach ist es am einfachsten, IPTW-Gewichte (Inverse Probability-of-Treatment) zu verwenden, um den Datensatz zu gewichten, und dann auch Variablen in ein normales Regressionsmodell aufzunehmen. So nähern sich die Autoren dem Problem in dem oben verlinkten Artikel. Es gibt auch andere Optionen, die normalerweise auf Neigungswerten basieren, die entweder für das Matching oder als Kovariate im Modell verwendet werden.
Es gibt viele Einführungen in IPTW in der von Ihnen bevorzugten statistischen Sprache. Ich würde Codefragmente bereitstellen, aber alle von mir sind in SAS und würden wahrscheinlich sehr ähnlich wie die Autoren lesen.
Kurz gesagt, Sie modellieren die Wahrscheinlichkeit einer Exposition basierend auf Ihren Kovariaten mithilfe einer logistischen Regression und schätzen die vorhergesagte Wahrscheinlichkeit einer Exposition basierend auf diesem Modell. Dies gibt Ihnen eine Neigungsbewertung. Die inverse Wahrscheinlichkeit des Behandlungsgewichts beträgt, wie der Name schon sagt, 1 / Propensity Score. Dies führt manchmal zu Extremwerten, sodass einige Personen das Gewicht stabilisieren, indem sie die marginale Expositionswahrscheinlichkeit (erhalten durch ein logistisches Regressionsmodell des Ergebnisses und ohne Kovariaten) in der obigen Gleichung durch 1 ersetzen .
Anstatt jedes Subjekt in Ihrer Analyse als 1 Subjekt zu behandeln, behandeln Sie sie jetzt als n Kopien eines Subjekts, wobei n ihr Gewicht ist. Wenn Sie Ihr Regressionsmodell mit diesen Gewichten und einschließlich Kovariaten ausführen, erhalten Sie eine doppelt belastbare Schätzung.
Ein Wort der Vorsicht: Eine doppelte (oder dreifache usw.) robuste Schätzung bietet Ihnen zwar mehr Chancen, das richtige Kovariatenmodell anzugeben, garantiert jedoch nicht, dass Sie dies tun werden. Und was noch wichtiger ist, ich kann Sie nicht vor ungemessenen Verwirrungen bewahren.
quelle
Es sieht so aus, als ob es eine Implementierung in Stata gab, noch bevor der von Ihnen zitierte Artikel veröffentlicht wurde: http://www.stata-journal.com/article.html?article=st0149 .
quelle
Das tmle R-Paket implementierte den Targeted Minimum Loss Based Estimator, der unter bestimmten Bedingungen doppelt robust und effizient ist. Es hat den zusätzlichen Vorteil, dass es ein Substitutionsschätzer ist, im Gegensatz zum Augmented IPTW (von dem ich annehme, dass Sie sich darauf beziehen).
quelle
tmle
Paket bestimmt ist, möglicherweise einen Link zu weiteren Informationen und wo Sie es erhalten.Ich habe den in Funk et al. 2011 (erweiterte inverse Wahrscheinlichkeitsgewichte), implementiert in der
zEpid
Python 3-Bibliothek innerhalb derAIPTW
Klasse. Details und Syntax finden Sie HIER . Die Bibliothek enthält auch TMLE, falls Sie beide Ansätze verwenden möchtenquelle
Es gibt ein R-Paket, das diesen DR-Schätzer der ATE (sowie einige andere Dinge)
npcausal
implementiert , das Paket: https://github.com/ehkennedy/npcausalDie Funktion, die zu einem DR-Schätzer passt, ist
ate()
quelle