Cox-Proportional-Hazard-Modell und Interpretation von Koeffizienten bei höherer Fallinteraktion

9

Hier ist die zusammenfassende Ausgabe des von mir verwendeten Coxph-Modells (ich habe R verwendet und die Ausgabe basiert auf dem besten endgültigen Modell, dh alle signifikanten erklärenden Variablen und ihre Wechselwirkungen sind enthalten):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

Die Frage ist:

Wie sind in diesem Fall Koeffizienten- und Exp (Coef) -Werte zu interpretieren, da es sich um sehr große Werte handelt? Es handelt sich auch um eine 3-Fall-Interaktion, die die Interpretation mehr verwirrt.

Alle Beispiele bezüglich des Coxph-Modells, die ich bisher online gefunden habe, waren wirklich einfach in Bezug auf die Interkationsterme (die sich immer als nicht signifikant herausgestellt haben) sowie Koeffizientenwerte (= Gefährdungsraten) und Exponentiale dieser (= Gefährdungsverhältnisse). waren ziemlich kleine und "leicht zu handhabende" Zahlen, zB Koeffizient = 1,73 -> exp (coef) = 5,64. ABER meine sind viel größere Zahlen, wie Sie aus der Zusammenfassung (oben) sehen können. Und weil sie so große Vaues sind, scheinen sie fast keinen Sinn zu ergeben.

Es scheint ein bisschen lächerlich zu sein zu denken, dass das Überleben zB 8,815e + 34 (Hazard Ratio aus der Interaktion LT: Food: Temp2) mal niedriger ist, wenn die Interaktion um eine Einheit zunimmt (?).

Eigentlich weiß ich auch nicht, wie ich diese 3-Fall-Interaktion interpretieren soll. Bedeutet dies, dass wenn alle Variablen in der Interaktion um eine Einheit zunehmen, das Überleben um den bestimmten Betrag abnimmt (angegeben durch den exp (coef) -Wert)?

Wäre toll, wenn mir hier jemand weiterhelfen kann. :) :)

Unten ist der Teil meines Datenblattes, den ich für die Cox-Analyse verwendet habe. Hier können Sie sehen, dass ich für mehrere "Antwortvariablen" Zeit, Status "viele Male denselben erklärenden Variablenwert (dh LT, Lebensmittel und Temp2) verwendet habe. Diese erklärenden Variablenwerte sind bereits die Mittelwerte dieser Variablen (aufgrund des in der Natur festgelegten Feldarbeitsaufbaus war es nicht möglich, für jedes beobachtete Antwortindividuum einen individuellen erklärenden Variablenwert zu erhalten, daher die bereits in dieser Phase verwendeten Mittelwerte ), und dies würde auf Vorschlag 1 (?) antworten (siehe die erste Antwort).

Vorschlag 2 (siehe die erste Antwort): Ich benutze R und bin noch kein Supergott darin. :) Wenn ich also die Funktion Predict (cox.model, type = "expected") verwende, erhalte ich eine große Anzahl unterschiedlicher Werte und habe keine Ahnung, auf welche erklärende Variable sie sich beziehen und in welcher Reihenfolge. Oder ist es möglich, bestimmte Interaktionsterms in der Vorhersagefunktion hervorzuheben? Ich bin mir nicht sicher, ob ich mich hier sehr deutlich mache.

Vorschlag 3 (siehe 1. Antwort): Im Teil des Datenblatts unten sind die Einheiten verschiedener erklärender Variablen zu sehen. Sie sind alle unterschiedlich und enthalten Dezimalstellen. Kann das etwas mit dem Cox-Ergebnis zu tun haben?

Teil des Datenblattes:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

Prost, Unna

Unna
quelle
@ MansT: Schön, dass Sie die Frage bearbeitet haben
;-)

Antworten:

7

Ein paar Vorschläge, die nicht direkt mit CoxPH zusammenhängen, sondern mit Interaktionen und Kollinearität

1) Wenn Sie "verrückte" Werte wie diese erhalten, ist Kollinearität eine Möglichkeit. Dies ist häufig ein Problem, wenn Sie Interaktionen haben. Haben Sie alle Ihre Variablen zentriert (indem Sie den Mittelwert von jeder subtrahieren)?

2) Sie können eine Interaktion unter vielen nicht so einfach interpretieren. LT, Essen und Temp2 sind alle an vielen Interaktionen beteiligt. Schauen Sie sich also vorhergesagte Werte aus verschiedenen Kombinationen an.

3) Überprüfen Sie die Einheiten der verschiedenen Variablen. Wenn Sie verrückte Parameter erhalten, ist dies manchmal ein Problem von Einheiten (z. B. Messen einer menschlichen Größe in Millimetern oder Kilometern).

4) Sobald Sie das Problem behoben haben, kann ich mir die Auswirkungen verschiedener Interaktionen (insbesondere der Interaktionen auf höherer Ebene) am einfachsten vorstellen, indem Sie die vorhergesagten Werte mit verschiedenen Kombinationen der unabhängigen Werte grafisch darstellen.

Peter Flom - Monica wieder einsetzen
quelle
Hei, unten ist der Teil meines Datenblattes, den ich für die Cox-Analyse verwendet habe. Hier können Sie sehen, dass ich für mehrere Zeit- und Statusantwortvariablen viele Male denselben erklärenden Variablenwert (dh LT, Food und Temp2) verwendet habe. Diese erklärenden Variablenwerte sind bereits die Mittelwerte dieser Variablen (aufgrund des in der Natur festgelegten Feldarbeitsaufbaus war es nicht möglich, für jedes beobachtete Antwortindividuum einen individuellen erklärenden Variablenwert zu erhalten, daher die bereits in dieser Phase verwendeten Mittelwerte ), und dies würde auf Vorschlag 1 (?) antworten.
Unna
Vorschlag 2: Ich benutze R und bin noch kein Supergott darin. :) Wenn ich also die Funktion Predict (cox.model, type = "expected") verwende, erhalte ich eine große Anzahl unterschiedlicher Werte und habe keine Ahnung, auf welche erklärende Variable sie sich beziehen und in welcher Reihenfolge. Oder ist es möglich, bestimmte Interaktionsterms in der Vorhersagefunktion hervorzuheben? Ich bin mir nicht sicher, ob ich mich hier sehr deutlich mache.
Unna
Vorschlag 3: Im Teil des Datenblatts unten sind die Einheiten verschiedener erklärender Variablen zu sehen. Sie sind alle unterschiedlich und enthalten Dezimalstellen. Kann das etwas mit dem Cox-Ergebnis zu tun haben?
Unna
Zeit (Tage) Status LT (h) Lebensmittel (Portionen pro Tag) Temp2 (ºC) 28 0 14,42 4,46 3,049 22 0 14,42 4,46 3,049 9 1 14,42 4,46 3,049 24 0 15,33 4,45 2,595 24 0 15,33 4,45 2,595 19 1 15,33 4,45 2,595
Unna
Der obige Kommentar zu dem von mir verwendeten Datenblattbeispiel wird in der Tabellenform nicht angezeigt, aber ich hoffe, dass es möglich ist, daraus einen Sinn zu machen. :)
Unna