Wie interpretiere ich eine Überlebenskurve des Cox-Hazard-Modells?

9

Wie interpretieren Sie eine Überlebenskurve aus dem Cox-Proportional-Hazard-Modell?

Nehmen wir in diesem Spielzeugbeispiel an, wir haben ein Cox-Proportional-Hazard-Modell für ageVariablen in kidneyDaten und generieren die Überlebenskurve.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

Geben Sie hier die Bildbeschreibung ein

Welche Aussage ist zum Zeitpunkt zum Beispiel wahr? oder sind beide falsch?200

  • Statement 1: Wir werden 20% Themen halten können ( zum Beispiel , wenn wir Menschen, von Tag , sollen wir etwa haben links), 200 2001000200200

  • Aussage 2: Für eine bestimmte Person hat sie eine Überlebenschance von am Tag .20020%200


Mein Versuch: Ich denke nicht, dass die beiden Aussagen gleich sind (korrigieren Sie mich, wenn ich falsch liege), da wir nicht die iid-Annahme haben (die Überlebenszeit für alle Menschen basiert NICHT unabhängig von einer Verteilung). Es ähnelt der logistischen Regression in meiner Frage hier , die Gefährdungsrate jeder Person hängt von für diese Person ab.βTx

Haitao Du
quelle
Beachten Sie, dass Ihr Modell die Unabhängigkeit zwischen den Ereigniszeiten voraussetzt.
Ocram
Überlebensanalyse kann Unabhängigkeitsannahmen haben
Aksakal
Es scheint also, dass die Frage eher die R-Codierung als die reine Statistik betrifft. Man muss die Syntax und die Merkmale bestimmter Funktionen kennen, die im Beispiel verwendet werden. Wenn dies der Fall ist, ist dies nicht in irgendeiner Weise ein Off-Topic? Andernfalls müssen Sie denjenigen erklären, die R
Aksakal am

Antworten:

5

Da die Gefahr von den Kovariaten abhängt, funktioniert auch die Überlebensfunktion. Das Modell nimmt an, dass die Gefahrenfunktion eines Individuums mit covariate Vektor ist h ( t ; x ) = h 0 ( t ) e β ' x . Daher ist die kumulative hazard dieses Individuums H ( t ; x ) = t 0 h ( u , x ) D u = t 0 h 0 (x

h(t;x)=h0(t)eβx.
wo wir definieren H 0 ( t ) = t 0 h 0 ( u ) D u als Basislinie kumulative Gefahr. Die Überlebensfunktion für ein Individuum mit dem kovariaten Vektor x ist wiederum S ( t ; x ) = e - H ( t ;
H(t;x)=0th(u;x)du=0th0(u)eβxdu=H0(t)eβx,
H0(t)=0th0(u)dux wobei wir S 0 (t)= e - H 0 ( t ) als die Grundlinienüberlebensfunktion definieren.
S(t;x)=eH(t;x)=eH0eβx=S0(t)eβx
S0(t)=eH0(t)

β^S^0(t)xS^(t;x)=S^0(t)eβ^x

Um dies in R zu berechnen, geben Sie den Wert Ihrer Kovariaten im newdataArgument an. Wenn Sie beispielsweise die Überlebensfunktion für Personen im Alter von 70 Jahren in R möchten, tun Sie dies

plot(survfit(fit, newdata=data.frame(age=70)))

newdata?survfit.coxphS0(t)eβx¯

Jarle Tufto
quelle
Ich stimme mit Ihnen ein. Dies ist eine schön geschriebene Antwort. Ich entschuldige mich beim OP für meinen Fehler und schätze die Art und Weise, wie das OP ihn korrigiert hat.
Michael R. Chernick
@ hxd1101 Nachdem ich die Hilfeseite von survfit.coxphgenauer gelesen habe , habe ich einen Fehler in meiner Antwort korrigiert, siehe Update.
Jarle Tufto
2

Wir haben noch 20% Probanden (z. B. wenn wir 1000 Leute haben, sollten wir bis zum 200. Tag 200 übrig haben)? oder Für eine bestimmte Person hat sie eine 20% ige Überlebenschance am Tag 200?

In ihrer reinsten Form macht die Kaplan-Meier-Kurve in Ihrem Beispiel keine der obigen Aussagen.

Die erste Aussage macht eine vorausschauende Vorsprung hat . Die grundlegende Überlebenskurve beschreibt nur die Vergangenheit, Ihre Stichprobe. Ja, 20% Ihrer Probe haben bis zum 200. Tag überlebt. Werden 20% in den nächsten 200 Tagen überleben? Nicht unbedingt.

Um diese Aussage zu treffen, müssen Sie weitere Annahmen hinzufügen, ein Modell erstellen usw. Das Modell muss nicht einmal statistisch im Sinne einer logistischen Regression sein. Zum Beispiel könnte es PDE in der Epidemiologie usw. sein.

Ihre zweite Aussage basiert wahrscheinlich auf einer Art Homogenitätsannahme: Alle Menschen sind gleich.

Aksakal
quelle
xβT.x
@ hxd1011, es hängt von deinem Modell ab. Wenn Sie Autoteile modellieren, können Sie sehr gut davon ausgehen, dass sie gleich sind. Andererseits könnten ihre Fehler durch die Chargennummer korreliert werden, dann sind sie nicht gleich usw.
Aksakal
Ich habe meine Frage bearbeitet, um sie genauer auf das Cox-Modell abzustimmen. Gilt Ihre Antwort auf die Kaplan_Meier-Kurve noch?
Haitao Du
2

S.0(t)S.(t)

S.0(t)S.(t)x=0

Haitao Du
quelle
0

S.(t)=0,2t

t1- -h(t)h(t)

Zu den Annahmen: Ich dachte, dass die üblichen Koeffiziententests in einer Cox-Regressionseinstellung Unabhängigkeit voraussetzen, abhängig von beobachteten Kovariaten? Selbst die Kaplan-Meier-Schätzung scheint eine Unabhängigkeit zwischen Überlebenszeit und Zensur zu erfordern ( Referenz ). Aber ich könnte mich irren, daher sind Korrekturen willkommen.

juod
quelle