Vorhersage in der Cox-Regression

38

Ich mache eine multivariate Cox-Regression, ich habe meine signifikanten unabhängigen Variablen und Beta-Werte. Das Modell passt sehr gut zu meinen Daten.

Jetzt möchte ich mein Modell verwenden und das Überleben einer neuen Beobachtung vorhersagen. Ich bin mir nicht sicher, wie ich das mit einem Cox-Modell machen soll. Bei einer linearen oder logistischen Regression wäre es einfach, die Werte der neuen Beobachtung in die Regression zu setzen und sie mit Betas zu multiplizieren, und so habe ich die Vorhersage meines Ergebnisses.

Wie kann ich mein Grundrisiko bestimmen? Ich brauche es zusätzlich zur Berechnung der Vorhersage.

Wie geht das in einem Cox-Modell?

Marja
quelle

Antworten:

30

Im Anschluss an Cox - Modell, das geschätzte Risiko für die einzelnen mit covariate Vektor x i hat die Form H i ( t ) = h 0 ( t ) exp ( x ' i β ) , wobei β durch Maximierung der Wahrscheinlichkeit Teil gefunden wird , während H 0 von dem Schätzer Nelson-Aalen folgt, h 0 ( t i ) = d iichxich

h^ich(t)=h^0(t)exp(xichβ^),
β^h^0 mitt1,t2,...die unterschiedlichen Ereigniszeiten unddidie Zahl der Todesfälle beiti (siehe beispielsweiseAbschnitt 3.6).
h^0(tich)=dichj:tjtichexp(xjβ^)
t1t2,dichtich

S^ich(t)=S^0(t)exp(xichβ^)
S^0(t)=exp(-Λ^0(t))
Λ^0(t)=j:tjth^0(tj).

EDIT: Das könnte Sie auch interessieren :-)

Ocram
quelle
1
Das ist genau meine Frage ... Ich benötige eine Schätzung der Basis-Hazard-Funktion, um die Vorhersage richtig machen zu können? Kennen Sie eine Methode zur Abschätzung?
Marja
2
@Marjan Das Klappmesser spiegelt möglicherweise die durch die Variablenauswahl verursachte Unsicherheit nicht richtig wider. Der Bootstrap zeigt mehr Variabilität, wobei Variablen als "signifikant" gekennzeichnet sind. Wenn Sie eine "relative Validierung" durchführen möchten, können Sie nach der Korrektur der Überanpassung zeigen, dass eine prädiktive Diskriminierung gut ist. Dies erfordert nicht die Behandlung der Grundgefahr, sondern die Validierung der relativen logarithmischen Gefährdungsschätzungen. Die validateFunktion im R- rmsPaket in Verbindung mit der cphFunktion erledigt das. Der einzige validateSchritt-für-Schritt- Algorithmus, der in implementiert ist, ist ein Rückwärts-Abwärts-Schritt.
Frank Harrell
1
Es ist recht einfach, vorhergesagte relative Gefahren (dh den linearen Prädiktor) zu erhalten. Aber ich habe 1991 aufgehört SAS zu benutzen.
Frank Harrell
8
Der Link ist tot :-(.
gung - Reinstate Monica
2
Gibt es eine Möglichkeit, die Überlebenszeit T für eine bestimmte Person vorherzusagen? Ich meine, wenn man eine Liste von Werten für die Kovariaten gibt, wie kann man dann herausfinden, nach welcher Zeit das Individuum am wahrscheinlichsten stirbt?
statBeginner
14

Die Funktion predictSurvProbim pecPaket kann Ihnen absolute Risikoeinschätzungen für neue Daten basierend auf einem vorhandenen Cox-Modell geben, wenn Sie R verwenden.

Die mathematischen Details kann ich nicht erklären.

EDIT: Die Funktion liefert Überlebenswahrscheinlichkeiten, die ich bisher als 1- (Ereigniswahrscheinlichkeit) angenommen habe.

EDIT 2:

Auf das pec-Paket kann man verzichten. Wenn nur das Überlebenspaket verwendet wird, gibt die folgende Funktion das absolute Risiko basierend auf einem Cox-Modell zurück

risk = function(model, newdata, time) {
  as.numeric(1-summary(survfit(model, newdata = newdata, se.fit = F, conf.int = F), times = time)$surv)
}
miura
quelle
1-Überlebenswahrscheinlichkeit ist die kumulative Gefahr. Ich denke, das OP fordert die Momentangefahrenfunktion (der Grundlinie) oder eine Art geglättete Schätzung davon an ( muhazPakete in R).
ECII
1
1-Überlebenswahrscheinlichkeit ist nicht die kumulative Gefahr. In Ermangelung konkurrierender Risiken sind die beiden wie auf en.wikipedia.org/wiki/… beschrieben miteinander verbunden .
Miura
1-Überlebenswahrscheinlichkeit = Ausfallrate (nur 1x Ausfallmethode vorausgesetzt). Das Verhältnis der Überlebenswahrscheinlichkeit zum kumulativen Risiko wird in der akzeptierten Antwort umrissen: S(t)=exp(−Λ(t))Wo Λ(t)ist das kumulative Risiko?
NickBraunagel
11

Vielleicht möchten Sie auch so etwas ausprobieren? Passen Sie ein proportionales Cox-Gefährdungsmodell an und verwenden Sie es, um die vorhergesagte Überlebenskurve für eine neue Instanz zu erhalten.

Entnommen aus der Hilfedatei für die survfit.coxph in R (ich habe gerade den Zeilen-Teil hinzugefügt)

# fit a Cox proportional hazards model and plot the  
# predicted survival for a 60 year old 
fit <- coxph(Surv(futime, fustat) ~ age, data=ovarian) 
plot(survfit(fit, newdata=data.frame(age=60)),
     xscale=365.25, xlab="Years", ylab="Survival", conf.int=F) 
# also plot the predicted survival for a 70 year old
lines(survfit(fit, newdata=data.frame(age=70)),
     xscale=365.25, xlab="Years", ylab="Survival") 

Beachten Sie jedoch, dass der Patient, für den Sie eine Prognose abgeben, aus einer Gruppe stammen sollte, die qualitativ mit der Gruppe identisch ist, aus der Sie das Cox-Modell für proportionale Gefahren abgeleitet haben, das Sie für die Prognose verwendet haben Prognose.

Slak
quelle
6

Die basehazFunktion von survivalPaketen liefert die Grundgefahr zu den Ereigniszeitpunkten. Daraufhin können Sie die von ocram bereitgestellten Berechnungen verbessern und die ORs Ihrer Coxph-Schätzungen einbeziehen.

ECII
quelle
2

Der springende Punkt des Cox-Modells ist die Annahme des proportionalen Risikos und die Verwendung der Teilwahrscheinlichkeit. Bei der Teilwahrscheinlichkeit ist die Basislinien-Gefährdungsfunktion eliminiert. Sie müssen also keine angeben. Das ist das Schöne daran!

Michael Chernick
quelle
2
Wenn Sie jedoch eine Schätzung des Risikos oder des Überlebens für einen bestimmten Wert des Kovariatenvektors erhalten möchten, benötigen Sie eine Schätzung des Grundrisikos oder des Überlebens. Die Nelson-Aalen-Schätzung macht normalerweise den Job ...
Oktober
1
Beim Cox-Modell werden häufig zwei Überlebensfunktionen verglichen, und der Schlüssel ist die Hazard-Ratio und nicht die Hazard-Funktion. Das Grundrisiko ist wie ein Störparameter, den Cox mithilfe der Proportional-Hazard-Annahme so geschickt aus dem Problem eliminiert hat. Für jede Methode, die Sie zur Schätzung der Gefährdungsfunktion und / oder der Grundgefährdung im Kontext des Modells verwenden möchten, muss die Cox-Form des Modells verwendet werden, die die Proportionalität erzwingt.
Michael Chernick
Vielen Dank. Es wäre toll, wenn Sie meinen Kommentar zur Antwort von Ocram sehen würden. Vielleicht könntest du mir auch helfen?
Marja
3
Sie können sich auch auf Faktoren konzentrieren, die keine proportionalen Gefahren darstellen. Auf jeden Fall können das Cox-Modell und sein nachträglicher Schätzer des Grundrisikos verwendet werden, um vorhergesagte Quantile der Überlebenszeit, verschiedene Überlebenswahrscheinlichkeiten und die vorhergesagte mittlere Überlebenszeit zu erhalten, wenn Sie eine Langzeitbeobachtung durchführen. Alle diese Mengen sind in der R-Packung leicht zu bekommen rms.
Frank Harrell
Sie müssen es nicht angeben, aber es wird geschätzt.
DWin