Empfehlungen für nicht proportionale Gefahren

7

Dies ist ein Problem, das mich seit langem geplagt hat und in Lehrbüchern, Google oder Stack Exchange keine guten Antworten gefunden hat.

Ich habe einen Datensatz von> 100.000 Patienten, für die vier Behandlungen verglichen werden. Die Forschungsfrage ist, ob das Überleben zwischen diesen Behandlungen unterschiedlich ist, nachdem eine Reihe klinischer / demografischer Variablen berücksichtigt wurden. Die nicht angepasste KM-Kurve ist unten.

Geben Sie hier die Bildbeschreibung ein

Nicht proportionale Gefahren wurden durch jede von mir verwendete Methode angezeigt (z. B. nicht angepasste log-log-Überlebenskurven sowie Wechselwirkungen mit der Zeit und die Korrelation von Schönfield-Residuen und eingestufter Überlebenszeit, die auf angepassten Cox-PH-Modellen basierten). Die Log-Log-Überlebenskurve ist unten. Wie Sie sehen können, ist die Form der Nichtproportionalität ein Chaos. Obwohl keiner der Zwei-Gruppen-Vergleiche isoliert zu schwierig zu handhaben wäre, verwirrt mich die Tatsache, dass ich sechs Vergleiche habe, wirklich. Ich vermute, dass ich nicht alles in einem Modell bewältigen kann.

Geben Sie hier die Bildbeschreibung ein

Ich suche nach Empfehlungen, wie ich mit diesen Daten umgehen soll. Die Modellierung dieser Effekte mit einem erweiterten Cox-Modell ist angesichts der Anzahl der Vergleiche und der unterschiedlichen Formen der Nichtproportionalität wahrscheinlich nicht möglich. Da sie an Behandlungsunterschieden interessiert sind, ist ein geschichtetes Gesamtmodell keine Option, da ich diese Unterschiede nicht abschätzen kann.

Zögern Sie nicht, mich auseinander zu reißen, aber ich dachte darüber nach, zunächst ein geschichtetes Modell zu schätzen, um die Auswirkungen der anderen Kovariaten zu erhalten (natürlich die Annahme, dass keine Interaktion vorliegt), und dann für jedes Modell mehrere multivariable Cox-Modelle neu zu schätzen Zwei-Gruppen-Vergleich (also 6 Gesamtmodelle). Auf diese Weise kann ich die Form der Nichtproportionalität für jeden Zwei-Gruppen-Vergleich ansprechen und weniger falsch geschätzte HRs erhalten. Ich verstehe, dass die Standardfehler voreingenommen wären, aber angesichts der Stichprobengröße wird wahrscheinlich alles "statistisch" signifikant sein.

Ryan W.
quelle
Haben Sie versucht, klinische / demografische Variablen mit Neigungswerten anstelle der Cox-Regression anzupassen? Mit dieser Fülle von Daten könnte ein Propensity-Score-Matching möglich sein.
EdM
@EdM Nicht für diese Daten. Meine Unsicherheit darüber, wie genau die Neigungsbewertung mit mehreren Kategoriedaten (dh> 2 Kategorien) übereinstimmt, hat mich daran gehindert, diese Methode auszuprobieren. Nach meiner Erfahrung werden die Ergebnisse der multivariablen Analyse jedoch den Ergebnissen der Propensity-Score-Matched-Analyse sehr ähnlich sein (da der Zweck von beiden darin besteht, die Auswahlverzerrung anzugehen). Ich würde also vermuten, dass ich am Ende das gleiche Problem der Nichtproportionalität habe.
Ryan W.
Das ist für die Verwechslung nicht die Heterogenität der Ergebnisse.
Frank Harrell

Antworten:

3

Fantastische Frage fantastische Antworten. Ich möchte hinzufügen, dass Sie ein Modell in Betracht ziehen sollten, das sehr unterschiedliche Annahmen trifft, wie beispielsweise das logarithmische Überlebensmodell. Verwenden Sie die normale Umkehrfunktion für die y_axis anstelle von log-log. Müssen noch kovariieren anpassen. Betrachten Sie also auch die Normalität der durch die Behandlung geschichteten Residuen. Dies wird in einer Fallstudie am Ende meiner Kursnotizen unter http://biostat.mc.vanderbilt.edu/rms behandelt

Frank Harrell
quelle
Vielen Dank für Ihren Einblick. Ich hatte keine parametrischen Modelle in Betracht gezogen. Ich mache den größten Teil meiner Modellierung in SAS, daher waren Ihre Kursnotizen, die zeigen, wie das logarithmisch normale Modell mithilfe des Effektivwertpakets geschätzt wird, unglaublich nützlich. Obwohl die Passform des logarithmischen Normalmodells nicht ideal ist, glaube ich, dass es angemessen und ausreichend ist, um ( Residuen ) zu melden . Der PI muss unweigerlich daran erinnert werden, dass eine einzelne Studie keineswegs endgültig ist. Danke noch einmal.
Ryan W.
5

Sie haben sicherlich keine geringfügigen proportionalen Gefahren. Das bedeutet nicht, dass Sie keine bedingten proportionalen Gefahren haben!

Um dies genauer zu erklären, betrachten wir die folgende Situation: Nehmen wir an, wir haben Gruppe 1, die sehr homogen ist und eine konstante Gefahr = 1 aufweist. Jetzt haben wir in Gruppe zwei eine heterogene Population; 50% haben ein geringeres Risiko als Gruppe 1 (Gefahr = 0,5) und der Rest ist einem höheren Risiko ausgesetzt als Gruppe 1 (Gefahr = 3). Wenn wir wüssten, ob jeder in Gruppe 2 ein Subjekt mit höherem oder niedrigerem Risiko ist, dann hätte jeder natürlich proportionale Gefahren. Dies ist die bedingte Gefahr.

Nehmen wir jedoch an, wir wissen nicht (oder ignorieren) nicht, ob jemand in Gruppe 2 einem hohen oder niedrigen Risiko ausgesetzt ist. Dann ist die marginale Verteilung für sie die eines Mischungsmodells: 50% Wahrscheinlichkeit, dass sie eine Gefahr haben = 0,5, 50%, dass sie eine Gefahr haben = 3. Im Folgenden gebe ich einen R-Code zusammen mit einer Darstellung der beiden Gefahren.

# Function for computing the hazards from 
# a 50/50 heterogenious population
mix_hazard <- function(x, hzd1 = 0.5, hzd2 = 3){
  x_dens <- 0.5 * dexp(x, hzd1) + 0.5 * dexp(x, hzd2)
  x_s    <- 1 - ( 0.5 * pexp(x, hzd1) + 0.5 * pexp(x, hzd2)) 
  hzd    <- x_dens/x_s
  return(hzd)
}

x <- 0:100/20
plot(x, mix_hazard(x), 
     type = 'l',
     col = 'purple', ylim = c(0, 2), 
     xlab = 'Time', 
     ylab = 'Hazard', 
     lwd = 2)
lines(x, rep(1, length(x)), col = 'red', lwd = 2)

legend('topright', 
       legend = c('Homogeneous',
                  'Heterogeneous'), 
       lwd = 2,
       col = c('red', 'purple'))

Geben Sie hier die Bildbeschreibung ein

Wir sehen deutlich unproportionale Grenzgefahren! Beachten Sie jedoch, dass wir proportionale Gefahren hätten , wenn wir wüssten, ob es sich bei den Probanden in Gruppe 2 um Probanden mit hohem oder niedrigem Risiko handelt .

Wie wirkt sich das auf Sie aus? Nun, Sie haben erwähnt, dass Sie viele andere Kovariaten zu diesen Themen haben. Es ist sehr wahrscheinlich, dass die Gefahren nicht proportional sind, wenn wir diese Kovariaten ignorieren. Nach Bereinigung können Sie jedoch die Ursachen für die Heterogenität in den verschiedenen Gruppen erfassen und Ihr Problem mit nicht proportionalen Gefahren beheben.

Cliff AB
quelle
1
Danke für Ihre Antwort! Ihr Standpunkt ist gut aufgenommen, da sich das fehlende Kovariatenproblem als nicht proportionale Gefahren manifestieren kann. Ich habe vergessen zu erwähnen, dass ich, obwohl die Log-Log-Überlebenskurven nicht angepasst waren, die Nichtproportionalität unter Verwendung von Wechselwirkungen mit der Zeit sowie von Schönfield-Residuen getestet habe, nachdem ich alle interessierenden Kovariaten angepasst hatte. Ich habe meinen Beitrag bearbeitet, um dies widerzuspiegeln.
Ryan W.