Was ist der "

18

Was ist der Wert, der in der Zusammenfassung eines Coxph-Modells in R angegeben ist? Beispielsweise,R2

Rsquare= 0.186   (max possible= 0.991 )

Ich habe dummerweise ein Manuskript als Wert hinzugefügt, und der Prüfer hat darauf hingewiesen, dass ihm kein Analogon der Statistik aus der für das Cox-Modell entwickelten klassischen linearen Regression bekannt ist, und wenn es eine gibt, bitte Geben Sie eine Referenz an. Jede Hilfe wäre toll!R 2R2R2

Danielsbrewer
quelle
1
In den meisten Situationen, in denen das Konzept von über die klassische lineare Regression hinausgeht, handelt es sich um die quadratische Korrelation zwischen den beobachteten Werten und den im Modell vorhergesagten Werten. Könnte das hier möglicherweise zutreffen? R2
Makro
2
Nein, das hat nichts damit zu tun.
Frank Harrell

Antworten:

15

Mit können getS3method("summary","coxph")Sie sehen, wie es berechnet wird.

Die relevanten Codezeilen sind die folgenden:

logtest <- -2 * (cox$loglik[1] - cox$loglik[2])
rval$rsq <- c(rsq = 1 - exp(-logtest/cox$n), maxrsq = 1 - 
        exp(2 * cox$loglik[1]/cox$n))

Hier cox$loglikist "ein Vektor der Länge 2, der die logarithmische Wahrscheinlichkeit mit den Anfangswerten und den Endwerten der Koeffizienten enthält" (siehe ?coxph.object) und cox$n"Anzahl der Beobachtungen, die in der Anpassung verwendet wurden".

Roland
quelle
5
Wenn ich mich nicht irre, ist das das Pseudo-R-Quadrat von Cox & Snell. Erläuterungen und Vergleiche zu verschiedenen Pseudo-R-Quadraten finden Sie unter ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm .
am
4

ncoxph

Ronghui Xu
quelle
4
Falsch, Sie dividieren durch die Anzahl der Beobachtungen, egal wie seltsam das klingt. Bei der ursprünglichen Frage ist es seltsam, dass ein Rezensent nicht weiß, was es für das Cox-Modell seit 20 Jahren gibt.
Frank Harrell
Zusätzlich zum Austausch zwischen Ronghui Xu und @Frank Harrell klingt es nicht nur seltsam, wenn man es durch die Anzahl der Beobachtungen dividiert, es funktioniert auch nicht. Um dies zu sehen, betrachten Sie Beta als auf einen bestimmten Wert festgelegt, sodass ungefähr E (R2) = 0,5 und dieselbe Kovariatenverteilung, dh alles das Gleiche, abgesehen von der Tatsache, dass Studie 1 die doppelte Zensurrate aufweist wie Studie 2 Obwohl wir die gleiche Populationsmenge schätzen sollten, wird die R2-Schätzung in Studie 1 ungefähr die Hälfte derjenigen von Studie 2 betragen, unabhängig von der Stichprobengröße. Anstelle von 0,5 würden wir ungefähr 0,25 bekommen.
R2
Als Antwort auf Franks Bemerkung würde ich zustimmen, dass dies nicht einfach ist und dass Franks Beobachtung bezüglich der Null-Log-Wahrscheinlichkeit korrekt ist. Ich habe diese Größe immer nur als Annäherung an einen konsistenten Schätzer einer genau definierten Bevölkerungsmenge auf der Grundlage des Informationsgewinns angesehen. Das von Ronghui Xu erwähnte Papier führt Simulationen durch. Diese zeigen, dass die Auswirkungen der Zensur zwar nicht fehlen, aber viel schwächer sind, wenn wir durch die Anzahl der Fehler und nicht durch die Gesamtzahl der Beobachtungen dividieren.
1
R2