Überlebensanalyse: kontinuierlich gegen diskrete Zeit

20

Ich bin verwirrt darüber, wie ich entscheiden soll, ob die Zeit in der Überlebensanalyse als kontinuierlich oder diskret behandelt wird. Konkret möchte ich die Überlebensanalyse verwenden, um Variablen auf Kinder- und Haushaltsebene zu identifizieren, deren Einfluss auf das Überleben von Jungen und Mädchen (bis zum Alter von 5 Jahren) am unterschiedlichsten ist. Ich habe einen Datensatz mit dem Alter des Kindes (in Monaten) zusammen mit einem Indikator dafür, ob das Kind lebt, dem Alter zum Zeitpunkt des Todes (in Monaten) und anderen Variablen auf Kinder- und Haushaltsebene.

Da die Zeit in Monaten angegeben wird und alle Kinder unter 5 Jahren sind, gibt es viele Überlebenszeiten (oft in Abständen von einem halben Jahr: 0, 6, 12 usw.). Auf der Grundlage dessen, was ich über die Überlebensanalyse gelesen habe, denke ich, dass ich Zeit als diskret behandeln sollte, wenn ich viele zusammenhängende Überlebenszeiten habe. Ich habe jedoch mehrere andere Studien gelesen, in denen die Überlebenszeit beispielsweise in Personenjahren liegt (und daher gibt es sicherlich gebundene Überlebenszeiten), und es werden zeitkontinuierliche Methoden wie Cox-Proportional-Hazards verwendet.

Nach welchen Kriterien sollte ich entscheiden, ob ich die Zeit als kontinuierlich oder diskret behandeln möchte? Für meine Daten und meine Frage ist die Verwendung eines zeitkontinuierlichen Modells (Cox, Weibull usw.) für mich intuitiv sinnvoll, aber die Diskretion meiner Daten und die Anzahl der gebundenen Überlebenszeiten scheinen etwas anderes nahezulegen.

smm
quelle

Antworten:

10

Die Wahl des Überlebensmodells sollte sich nach dem zugrunde liegenden Phänomen richten. In diesem Fall scheint es kontinuierlich zu sein, auch wenn die Daten auf eine etwas diskrete Weise gesammelt werden. Eine Auflösung von einem Monat wäre über einen Zeitraum von 5 Jahren in Ordnung. Die große Anzahl von Krawatten nach 6 und 12 Monaten lässt jedoch die Frage aufkommen, ob Sie wirklich eine Genauigkeit von 1 Monat haben (die Krawatten bei 0 werden erwartet - das ist ein besonderer Wert, bei dem relativ viele Todesfälle tatsächlich passieren). Ich bin mir nicht ganz sicher, was Sie dagegen tun können, da dies höchstwahrscheinlich eher eine nachträgliche Rundung als eine Intervallzensierung widerspiegelt.

Aniko
quelle
2
Als Faustregel gilt, dass diskrete Daten, die in zehn oder mehr Teile unterteilt werden können, als fortlaufend behandelt werden können, auch wenn sie wirklich diskret sind (sechs Monate lang einmal monatlich und sechs Monate lang wöchentlich) oder einmal im Monat für zwei Jahre). Der folgende Artikel gibt auch einige zusätzliche Einblicke in die Behandlung diskreter Daten als fortlaufend: theanalysisfactor.com/count-data-considered-continuous
Tavrock
4

Ich vermute, wenn Sie kontinuierliche Zeitmodelle verwenden, sollten Sie die Intervallzensierung verwenden. Dies spiegelt die Tatsache wider, dass Sie nicht den genauen Zeitpunkt des Ausfalls kennen, sondern nur ein Intervall, in dem der Fehler aufgetreten ist. Wenn Sie parametrische Regressionsmodelle mit Intervallzensierung unter Verwendung der maximalen Wahrscheinlichkeit anpassen, ist die gebundene Überlebenszeit kein IIRC-Problem.

Dikran Beuteltier
quelle
4

In den meisten Analysen wird es gebundene Überlebenszeiten geben, aber große, klare Banden bei bestimmten Ereignissen sind problematisch. Ich würde lange und intensiv über die Studie selbst nachdenken, wie sie Daten sammelt usw.

Wie Sie das Überleben modellieren, hängt davon ab, ob der zugrunde liegende Prozess in der Welt diskret oder kontinuierlich ist.

Fomite
quelle
1

Wenn Sie Kovariaten haben, die für einige Personen im Zeitverlauf variieren (z. B. kann das Familieneinkommen in Ihrem Beispiel im Laufe des Lebens eines Kindes variieren), müssen Sie die Daten nach Überlebensmodellen (parametrisch und Cox-Modell) in diskrete Intervalle aufteilen, die durch definiert sind die unterschiedlichen Kovariaten.

Ich fand dieses Skript von German Rodriguez hilfreich.

sumtxt
quelle