Dies ist ein Problem, das mich seit langem geplagt hat und in Lehrbüchern, Google oder Stack Exchange keine guten Antworten gefunden hat.
Ich habe einen Datensatz von> 100.000 Patienten, für die vier Behandlungen verglichen werden. Die Forschungsfrage ist, ob das Überleben zwischen diesen Behandlungen unterschiedlich ist, nachdem eine Reihe klinischer / demografischer Variablen berücksichtigt wurden. Die nicht angepasste KM-Kurve ist unten.
Nicht proportionale Gefahren wurden durch jede von mir verwendete Methode angezeigt (z. B. nicht angepasste log-log-Überlebenskurven sowie Wechselwirkungen mit der Zeit und die Korrelation von Schönfield-Residuen und eingestufter Überlebenszeit, die auf angepassten Cox-PH-Modellen basierten). Die Log-Log-Überlebenskurve ist unten. Wie Sie sehen können, ist die Form der Nichtproportionalität ein Chaos. Obwohl keiner der Zwei-Gruppen-Vergleiche isoliert zu schwierig zu handhaben wäre, verwirrt mich die Tatsache, dass ich sechs Vergleiche habe, wirklich. Ich vermute, dass ich nicht alles in einem Modell bewältigen kann.
Ich suche nach Empfehlungen, wie ich mit diesen Daten umgehen soll. Die Modellierung dieser Effekte mit einem erweiterten Cox-Modell ist angesichts der Anzahl der Vergleiche und der unterschiedlichen Formen der Nichtproportionalität wahrscheinlich nicht möglich. Da sie an Behandlungsunterschieden interessiert sind, ist ein geschichtetes Gesamtmodell keine Option, da ich diese Unterschiede nicht abschätzen kann.
Zögern Sie nicht, mich auseinander zu reißen, aber ich dachte darüber nach, zunächst ein geschichtetes Modell zu schätzen, um die Auswirkungen der anderen Kovariaten zu erhalten (natürlich die Annahme, dass keine Interaktion vorliegt), und dann für jedes Modell mehrere multivariable Cox-Modelle neu zu schätzen Zwei-Gruppen-Vergleich (also 6 Gesamtmodelle). Auf diese Weise kann ich die Form der Nichtproportionalität für jeden Zwei-Gruppen-Vergleich ansprechen und weniger falsch geschätzte HRs erhalten. Ich verstehe, dass die Standardfehler voreingenommen wären, aber angesichts der Stichprobengröße wird wahrscheinlich alles "statistisch" signifikant sein.
quelle
Antworten:
Fantastische Frage fantastische Antworten. Ich möchte hinzufügen, dass Sie ein Modell in Betracht ziehen sollten, das sehr unterschiedliche Annahmen trifft, wie beispielsweise das logarithmische Überlebensmodell. Verwenden Sie die normale Umkehrfunktion für die y_axis anstelle von log-log. Müssen noch kovariieren anpassen. Betrachten Sie also auch die Normalität der durch die Behandlung geschichteten Residuen. Dies wird in einer Fallstudie am Ende meiner Kursnotizen unter http://biostat.mc.vanderbilt.edu/rms behandelt
quelle
Sie haben sicherlich keine geringfügigen proportionalen Gefahren. Das bedeutet nicht, dass Sie keine bedingten proportionalen Gefahren haben!
Um dies genauer zu erklären, betrachten wir die folgende Situation: Nehmen wir an, wir haben Gruppe 1, die sehr homogen ist und eine konstante Gefahr = 1 aufweist. Jetzt haben wir in Gruppe zwei eine heterogene Population; 50% haben ein geringeres Risiko als Gruppe 1 (Gefahr = 0,5) und der Rest ist einem höheren Risiko ausgesetzt als Gruppe 1 (Gefahr = 3). Wenn wir wüssten, ob jeder in Gruppe 2 ein Subjekt mit höherem oder niedrigerem Risiko ist, dann hätte jeder natürlich proportionale Gefahren. Dies ist die bedingte Gefahr.
Nehmen wir jedoch an, wir wissen nicht (oder ignorieren) nicht, ob jemand in Gruppe 2 einem hohen oder niedrigen Risiko ausgesetzt ist. Dann ist die marginale Verteilung für sie die eines Mischungsmodells: 50% Wahrscheinlichkeit, dass sie eine Gefahr haben = 0,5, 50%, dass sie eine Gefahr haben = 3. Im Folgenden gebe ich einen R-Code zusammen mit einer Darstellung der beiden Gefahren.
Wir sehen deutlich unproportionale Grenzgefahren! Beachten Sie jedoch, dass wir proportionale Gefahren hätten , wenn wir wüssten, ob es sich bei den Probanden in Gruppe 2 um Probanden mit hohem oder niedrigem Risiko handelt .
Wie wirkt sich das auf Sie aus? Nun, Sie haben erwähnt, dass Sie viele andere Kovariaten zu diesen Themen haben. Es ist sehr wahrscheinlich, dass die Gefahren nicht proportional sind, wenn wir diese Kovariaten ignorieren. Nach Bereinigung können Sie jedoch die Ursachen für die Heterogenität in den verschiedenen Gruppen erfassen und Ihr Problem mit nicht proportionalen Gefahren beheben.
quelle