Wie interpretieren Sie eine Überlebenskurve aus dem Cox-Proportional-Hazard-Modell?
Nehmen wir in diesem Spielzeugbeispiel an, wir haben ein Cox-Proportional-Hazard-Modell für age
Variablen in kidney
Daten und generieren die Überlebenskurve.
library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()
Welche Aussage ist zum Zeitpunkt zum Beispiel wahr? oder sind beide falsch?
Statement 1: Wir werden 20% Themen halten können ( zum Beispiel , wenn wir Menschen, von Tag , sollen wir etwa haben links), 200 200
Aussage 2: Für eine bestimmte Person hat sie eine Überlebenschance von am Tag .200
Mein Versuch: Ich denke nicht, dass die beiden Aussagen gleich sind (korrigieren Sie mich, wenn ich falsch liege), da wir nicht die iid-Annahme haben (die Überlebenszeit für alle Menschen basiert NICHT unabhängig von einer Verteilung). Es ähnelt der logistischen Regression in meiner Frage hier , die Gefährdungsrate jeder Person hängt von für diese Person ab.
quelle
Antworten:
Da die Gefahr von den Kovariaten abhängt, funktioniert auch die Überlebensfunktion. Das Modell nimmt an, dass die Gefahrenfunktion eines Individuums mit covariate Vektor ist h ( t ; x ) = h 0 ( t ) e β ' x . Daher ist die kumulative hazard dieses Individuums H ( t ; x ) = ∫ t 0 h ( u , x ) D u = ∫ t 0 h 0 (x
Um dies in R zu berechnen, geben Sie den Wert Ihrer Kovariaten im
newdata
Argument an. Wenn Sie beispielsweise die Überlebensfunktion für Personen im Alter von 70 Jahren in R möchten, tun Sie diesnewdata
?survfit.coxph
quelle
survfit.coxph
genauer gelesen habe , habe ich einen Fehler in meiner Antwort korrigiert, siehe Update.In ihrer reinsten Form macht die Kaplan-Meier-Kurve in Ihrem Beispiel keine der obigen Aussagen.
Die erste Aussage macht eine vorausschauende Vorsprung hat . Die grundlegende Überlebenskurve beschreibt nur die Vergangenheit, Ihre Stichprobe. Ja, 20% Ihrer Probe haben bis zum 200. Tag überlebt. Werden 20% in den nächsten 200 Tagen überleben? Nicht unbedingt.
Um diese Aussage zu treffen, müssen Sie weitere Annahmen hinzufügen, ein Modell erstellen usw. Das Modell muss nicht einmal statistisch im Sinne einer logistischen Regression sein. Zum Beispiel könnte es PDE in der Epidemiologie usw. sein.
Ihre zweite Aussage basiert wahrscheinlich auf einer Art Homogenitätsannahme: Alle Menschen sind gleich.
quelle
quelle
Zu den Annahmen: Ich dachte, dass die üblichen Koeffiziententests in einer Cox-Regressionseinstellung Unabhängigkeit voraussetzen, abhängig von beobachteten Kovariaten? Selbst die Kaplan-Meier-Schätzung scheint eine Unabhängigkeit zwischen Überlebenszeit und Zensur zu erfordern ( Referenz ). Aber ich könnte mich irren, daher sind Korrekturen willkommen.
quelle