Überlebensanalyse in R mit links abgeschnittenen Daten

8

Ich mache eine Überlebensanalyse in R mit dem survivalPaket. Ich glaube, ich arbeite mit links abgeschnittenen Daten, bin mir aber nicht ganz sicher, wie ich damit umgehen soll.

Ich habe eine Kohorte von Patienten, die zwischen 1990 und 2012 diagnostiziert wurden. Alle Patienten haben einen genau definierten Diagnosezeitpunkt (Eintrittszeit). Das interessierende Ergebnis (spezifische Verschlechterung der Krankheit) wurde jedoch erst ab dem Jahr 2000 dokumentiert. Bei Patienten, die vor 2000 diagnostiziert wurden, ist daher nicht bekannt, ob das Ergebnis vor diesem Zeitpunkt eingetreten ist - erst danach.

Mein erster Gedanke war, dass ich die Analyse auf den Zeitraum ab 2000 beschränken musste, nur Patienten, die nach diesem Zeitpunkt diagnostiziert wurden. Nach einigem Lesen scheint es unnötig zu sein, Patienten auszuschließen, die vor 2000 diagnostiziert wurden. Dies scheint eine Linksabschneidung zu sein, und dies kann bei der coxphVerwendung behandelt werden Surv(time1, time2, event), wobei time1 die Linksabschneidungszeit ist (Zeit von der Diagnose bis zum Beginn der Dokumentation von das Ergebnis) und Zeitpunkt 2 ist die Zeit bis zum Ereignis (ab dem Zeitpunkt der Diagnose).

Hier sind zwei Beispiele für Patienten in meinem Datensatz:

Patient Nr. 1: Diagnose 1999. Ergebnis 2001 beobachtet. Verkürzungszeit links: 1 Jahr (bis 2000). Zeit bis zur Veranstaltung: 2 Jahre.

Patient Nr. 2: Diagnose 2001. Ergebnis 2005 beobachtet. Linksverkürzungszeit: 0 Jahre. Zeit bis zur Veranstaltung: 4 Jahre.

Für diese Patienten würde ihre Überlebenszeit (in Jahren) im Überlebensobjekt (jeweils) betragen:

Surv(time1 = c(1,0), time2 = c(2,4), event = c(1,1))

Ist dies ein Beispiel für links abgeschnittene Daten? Wenn ja, ist dies der richtige Weg, um damit umzugehen?

user3766836
quelle

Antworten:

3

Ich gehe davon aus, dass die Zeit ab der Diagnose Ihre zugrunde liegende Zeitvariable ist. Der Einfachheit halber gehe ich auch davon aus, dass das Ereignis nur einmal auftreten kann.

Sie können Ihre Daten als linkszensiert behandeln. Dies unterscheidet sich jedoch davon, dass Sie links abgeschnitten sind.

Für links abgeschnittene Daten nehmen wir nur Patienten in die Studie auf, die davon abhängig sind, dass sie das Ereignis zum Zeitpunkt der Aufnahme nicht erlebt haben. Dies würde in Ihrem Fall bedeuten, die Patienten, die das Ereignis vor 2000 hatten, wegzuwerfen. Daher modellieren wir das Überleben, das vom Überleben bis zur Aufnahme abhängig ist.

Dies unterscheidet sich von der Linkszensur. Linkszensur tritt auf, wenn wir nur die Obergrenze der Zeit eines Ereignisses kennen. Genau das schlagen Sie sich vor, wenn ich Sie richtig verstehe. In diesem Fall schließen wir alle Personen unabhängig von ihrer Überlebenszeit ein, aber für einige Personen kennen wir nur eine Obergrenze ihrer Überlebenszeit.

Kapitel III statistischer Modelle basierend auf Zählprozessen von PK Andersen et al. bietet eine gute Erklärung des oben Gesagten zusammen mit einigen Beispielen für beide Fälle.

swmo
quelle
2

Es ist wahrscheinlich, dass Sie der unsterblichen Zeitverzerrung zuwiderlaufen , was bedeutet, dass die vor 2000 diagnostizierte Kohorte effektiv unsterblich ist, bis nach 2000 das Ergebnis eintreten kann. Nach Rothman und Grönland besteht der richtige Ansatz darin, die Beobachtung vor 2000 Jahren von der Analyse auszuschließen (abzuschneiden) oder das Risiko einer Verzerrung zwischen Kohortenschätzungen in Richtung der Nullhypothese ohne Unterschied in der Gefährdung einzugehen.

Der survivalBefehl Survscheint nicht der von Ihnen verwendeten Syntax zu folgen. Was ist mit dem Erstellen einer neuen Variablen, bei der der Wert 0 dem Beginn der (Studien-) Zeit entspricht (z. B. Jahr = 2000?), 1 einer Zeiteinheit in usw. entspricht?

Lesen Sie weiter: Rothman, KJ und Greenland, S. (1998). Moderne Epidemiologie , Kapitel Kohortenstudien - Zeit unsterblicher Personen. Lippincott-Raven, 2. Auflage.

Alexis
quelle
Ich sehe, dass eine unsterbliche Zeitverzerrung wichtig ist, zum Beispiel in Arzneimittelstudien, in denen Patienten, die das Arzneimittel erhalten, aufgrund des Studiendesigns garantiert eine bestimmte Zeit leben, während dies bei der Kontrollgruppe nicht der Fall ist, was zu einer beobachteten (falsch) positiven Wirkung des Arzneimittels führt. In meinem Fall ist das Fehlen von Ergebnisdaten jedoch für alle Patienten unabhängig von der Exposition gleich. Das Auslassen aller vor 2000 diagnostizierten Patienten führt zu einem schwerwiegenden Mangel an statistischer Aussagekraft, da viele von ihnen das Ergebnis nach 2000 erleben werden. Ich denke, es muss eine Möglichkeit geben, mögliche Verzerrungen zu kontrollieren, ohne diese Patienten auszulassen.
user3766836
Ah ich verstehe, das war nicht klar. Auf der anderen Seite: Vielleicht unterstützen Ihre Daten die Analyse, die Sie durchführen möchten, einfach nicht.
Alexis