Diskrete Zeitrisikomodelle (Cloglog) in R.

10

Das survivalPaket in Rscheint sich auf kontinuierliche zeitliche Überlebensmodelle zu konzentrieren. Ich bin daran interessiert, eine zeitdiskrete Version eines proportionalen Gefährdungsmodells, des komplementären Log-Log-Modells, zu schätzen. Ich habe ein ziemlich einfaches Überlebensmodell mit einfacher richtiger Zensur.

Ich weiß, dass eine Möglichkeit, dieses Modell zu schätzen, darin besteht, einen Datensatz zu erstellen, der für jede Beobachtung eine separate Zeile für jeden Zeitraum enthält, in dem es nicht "tot" ist. Dann kann ein glmModell mit dem cloglogLink verwendet werden.

Dieser Ansatz scheint sehr speichereffizient zu sein. In der Tat würde es wahrscheinlich einen Datensatz erzeugen, der zu groß für den Speicher auf meinem Computer ist.

Ein zweiter Ansatz wäre, die MLE selbst zu codieren. Das wäre einfach genug, aber ich hoffe, dass es ein Paket gibt, in dem dieses Überlebensmodell in Dosen ist. Es wäre für die Zusammenarbeit und die Vermeidung von Codierungsfehlern einfacher, ein Paket zu verwenden.

Kennt jemand ein solches Paket?

Charlie
quelle
2
Wenn dies diskrete Zeit ist, müssen Sie viele Bindungen haben, richtig? Ich habe den Eindruck, dass das Modell coxph(ties="exact")im Standardpaket survival"ein bedingtes logistisches Modell ist und angemessen ist, wenn die Zeiten eine kleine Menge diskreter Werte sind". Würde das bei Ihnen nicht funktionieren? Ist das b / c, würde es den cloglogLink nicht verwenden?
Gung - Reinstate Monica
1
@gung, Danke für den Zeiger; Ich wusste nichts über diese Funktion. Ich würde jedoch lieber den cloglogLink verwenden.
Charlie

Antworten:

8

Mehrere Zeilen für jede Beobachtung zu haben, mag überflüssig erscheinen, ist es aber wahrscheinlich nicht. Wenn das Modell zeitlich variierende Kovariaten enthält, benötigt jeder Beobachtungsmonat mit Sicherheit eine eigene Zeile. Ein besonderes Beispiel für eine zeitlich veränderliche Kovariate ist die verstrichene Zeit. Da diese Variable mit ziemlicher Sicherheit in das Modell aufgenommen werden sollte, ist es sinnvoll, für jeden Beobachtungszeitraum eine eigene Zeile zu haben. Daher ist der erste vorgeschlagene Ansatz wahrscheinlich der beste.

Beachten Sie, dass sich dies von einem kontinuierlichen zeitproportionalen Gefährdungsmodell mit einer Weibull-Verteilung unterscheidet. Dort kann das Überlebensmodell für jede Beobachtung auf eine einzige Linie vereinfacht werden, wenn die verstrichene Zeit die einzige zeitlich variierende Kovariate ist (siehe hier zum Beispiel). Ein ähnliches Ergebnis gilt für das Cox-Proportional-Hazard-Modell.

Charlie
quelle