Was ist der Unterschied zwischen der Ausgabe von "coef" und "(exp) coef" von coxph in R?

14

Ich habe versucht zu erkennen, was genau die Ausgabe von "coef" und "(exp) coef" von coxph bedeutet. Es scheint, dass die "(exp) coef" Vergleiche der ersten Variablen im Modell gemäß der im Befehl zugewiesenen Gruppe sind.

Wie kommt die Coxph-Funktion zu den Werten für "coef" und "(exp) coef"?

Wie ermittelt coxph diese Werte zusätzlich, wenn es sich um eine Zensur handelt?

Annemphillip
quelle

Antworten:

21

Wenn Sie eine einzige erklärende Variable haben, z. B. eine Behandlungsgruppe, wird das Cox-Regressionsmodell mit angepasst coxph(). Der Koeffizient ( coef) ist ein Regressionskoeffizient (im Zusammenhang mit dem Cox-Modell, das im Folgenden beschrieben wird), und sein Exponential gibt das Risiko in der Behandlungsgruppe an (im Vergleich zur Kontroll- oder Placebogruppe). Wenn zum Beispiel , dann ist die Gefahr , das sind 16,5%.exp(-1,80)=0,165β^=1.80exp(1.80)=0.165

Wie Sie vielleicht wissen, ist die Gefahrenfunktion wie folgt modelliert

h(t)=h0(t)exp(βx)

Dabei ist das Grundrisiko. Die Gefährdungen hängen multiplikativ von den Kovariaten ab, und ist das Verhältnis der Gefährdungen zwischen zwei Individuen, deren Werte von sich um eine Einheit unterscheiden, wenn alle anderen Kovariaten konstant gehalten werden. Das Verhältnis der Gefährdungen von zwei beliebigen Individuen und ist und wird das Gefährdungsverhältnis (oder Inzidenzratenverhältnis) genannt. Es wird angenommen, dass dieses Verhältnis über die Zeit konstant ist, daher der Name der proportionalen Gefahr .exp ( & bgr; 1 ) x 1 i j exp ( & bgr; ' ( x i - x j ) )h0(t)exp(β1)x1ijexp(β(xixj))

Um Ihre vorhergehende Frage zusurvreg , wird hier die Form von nicht spezifiziert; genauer gesagt handelt es sich hierbei um ein semi-parametrisches Modell, bei dem nur die Auswirkungen von Kovariaten und nicht die Hazard-Funktion parametrisiert werden. Mit anderen Worten, wir machen keine Verteilungsannahme über die Überlebenszeiten.h0(t)

Die Regressionsparameter werden durch Maximieren der durch definierten partiellen Log-Wahrscheinlichkeit geschätzt

=flog(exp(βxf)r(f)exp(βxr))

Wenn die erste Summe über alle Todesfälle oder Misserfolge und die zweite Summe über alle Subjekte die zum Zeitpunkt des Scheiterns noch am Leben (aber gefährdet) sind, wird dies als Risikogruppe bezeichnet . Mit anderen Worten, kann als die Wahrscheinlichkeit des Log-Profils für nach Eliminierung von interpretiert werden (oder mit anderen Worten, die LL, bei der durch Funktionen von , die die Wahrscheinlichkeit mit maximieren bezüglich für einen festen Vektor ).fr(f)βh0(t)h0(t)βh0(t)β

Über die Zensur ist nicht klar, ob Sie sich auf die Linkszensur beziehen (wie dies der Fall sein könnte, wenn wir einen Ursprung für die Zeitskala betrachten, die vor dem Zeitpunkt liegt, zu dem die Beobachtung begann, auch als verzögerte Eingabe bezeichnet ) oder auf die Rechtszensur. Weitere Informationen zur Berechnung der Regressionskoeffizienten und zur Handhabung der Zensur durch das Überlebenspaket finden Sie in Therneau und Grambsch, Modelling Survival Data (Springer, 2000). Terry Therneau ist der Autor des früheren S-Pakets. Ein Online-Tutorial ist verfügbar.

Die Survival Analysis in R von David Diez bietet eine gute Einführung in die Survival Analysis in R. Ein kurzer Überblick über Tests für Regressionsparameter wird auf S. gegeben. 10. Dies sollte hoffentlich dazu beitragen, die von @onestop angegebene Online-Hilfe zu klären : "Koeffizienten die Koeffizienten des linearen Prädiktors, der die Spalten der Modellmatrix multipliziert." Für ein angewandtes Lehrbuch empfehle ich die Analyse medizinischer Daten mit S-PLUS von Everitt und Rabe-Hesketh (Springer, 2001, Kap. 16 und 17), aus denen die meisten der oben genannten Quellen stammen. Eine weitere nützliche Referenz ist der Anhang von John Fox zur Cox-Regression proportionaler Gefahren für Überlebensdaten .χ2

chl
quelle
4
+1, das ist eine wirklich informative Antwort auf eine ziemlich einfache und unkomplizierte Frage. Ich schätze besonders die Links zu Ressourcen für weitere Informationen. Hinweis: Der Link zum Online-Tutorial von Terry Therneau ist nicht mehr vorhanden. Ein Paket für die Überlebensanalyse in S kann eine Live-Verknüpfung zu demselben Material sein.
gung - Reinstate Monica
5

So zitieren Sie die Dokumentation für die Druckmethode für ein Coxph-Objekt, die Sie in R erhalten, indem Sie Folgendes eingeben ?survival::print.coxph:

coefficients die Koeffizienten des linearen Prädiktors, die die Spalten der Modellmatrix multiplizieren.

Das ist die gesamte Dokumentation, die der Autor des Pakets zur Verfügung stellt. Die Packung enthält keine Bedienungsanleitung oder Packungsvignette. R ist nicht benutzerfreundlich und die Dokumentation setzt voraus, dass Sie die statistischen Methoden bereits verstanden haben.

Ich nehme an, dass die coefSpalte das Obige ergibt coefficientsund die exp(coef)Spalte das Exponential von diesen ist. Da die Cox-Regression eine logarithmische Verknüpfungsfunktion beinhaltet, sind die Koeffizienten die logarithmischen Gefährdungsverhältnisse. Wenn Sie sie potenzieren, erhalten Sie daher die entsprechenden Risikoquoten zurück.

ein Stop
quelle