Welche Beziehung besteht zwischen Cox-Regression und Tobit-Regression?

7

Um zensierte Daten zu verarbeiten, verwenden einige Forscher zensierte Regressionsmethoden wie die Tobit-Regression , andere klassische Überlebensanalysemodelle wie die Cox-Regression .

Ich weiß, dass Cox-Regression und Tobit-Regression aus mathematischer Sicht zwei verschiedene Modelle sind.

Meine Fragen: Was sind die Vor- und Nachteile dieser beiden Methoden? Welche Probleme können sie jeweils gut lösen? Haben sie unterschiedliche Annahmen?

Münchenong
quelle

Antworten:

3

Abgekürzte Modellbeschreibungen

Das Cox-Modell ist ein Überlebensmodell, das die Gefährdungsquoten anhand der beobachteten Ränge der Daten geschickt modelliert, ohne die zugrunde liegende Basislinienverteilung annehmen zu müssen, aber dennoch die proportionale Gefährdungsannahme erfordert.

Das Tobit-Modell ist im Wesentlichen eine lineare Standardregression, mit der Ausnahme, dass es auch zensierte Daten verarbeiten kann. Die angenommene Verteilung ist dann normal.

Vor-und Nachteile

Cox-Modell:

Pro: Sie müssen keine Annahmen über die Basisverteilung treffen. Dies ist sehr wichtig für das Überleben Analyse: Time-to-Ereignisdaten tendenziell sehr mit extrem schweren rechtsem Schwanz nicht normal, oft. Wenn Sie nur den Rang der Daten berücksichtigen, erhalten Sie außerdem ein Modell, das gegenüber den erwarteten Ausreißern robuster ist.

Nachteile: Es kann sehr schwierig sein, Koeffizienteneffekte zu interpretieren.

Tobit Modell:

Pro: Einfache Erweiterung eines Modells, mit dem die meisten Analysten bereits vertraut sind, um eine Zensur zu ermöglichen. Wenn also alle Ihre Daten beobachtet wurden und für eine lineare Regression geeignet sind (mit einer im Abschnitt Nachteile genannten Einschränkung), wäre es angebracht, ein Tobit-Modell zu verwenden .

Nachteile: Erfordert die Annahme linearer Effekte und Gaußscher Fehler. In einigen Anwendungen ist dies völlig angemessen, aber die Zeit bis zum Ereignis (dh die Überlebensanalyse) entspricht selten diesen Kriterien. Auch die Feststellung, es wert ist, dass das Tobit - Modell ist mehr empfindlich auf die Normalitätsannahme als Vanille-lineare Regression.

Cliff AB
quelle
Die (potenzierten) Cox-Regressionskoeffizienten werden als Hazard Ratio (HR) interpretiert, wobei eine Gefahr ein augenblickliches Risiko für das Auftreten eines Ergebnisses darstellt. Ich stimme etwas zu, dass es schwierig sein kann, dies zu erklären, obwohl wir in den Gesundheitswissenschaften HRs oft als Risikokennzahlen interpretieren, was angemessen ist, wenn das Ergebnis selten ist.
AdamO
2

Weder ein normalverteilter Fehlerterm noch eine lineare Verknüpfung wären unter den meisten Umständen eine angemessene Wahl für die Modellierung der Ergebnisse der Zeit bis zum Ereignis. Die Verteilung der Ausfallzeiten neigt dazu, sich stark zu verzerren.

Bei Modellen ohne Zensur werden in den meisten Büchern zur Fehlerzeitanalyse parametrische Modelle behandelt. Dies sind exponentielle, Gamma- oder Weibull-Maximum-Likelihood-Verfahren. Eine logarithmische Transformation der Ereigniszeit könnte die Anwendung eines linearen Regressionsmodells rechtfertigen, und daher könnte das Tobit-Modell eine gewisse Anwendbarkeit für parametrische Modelle von lognormalen Daten mit Zensur haben. Die Begründung für lognormale Regressionsmodelle für Time-to-Event-Daten erscheint meiner Meinung nach zweifelhaft: Normalverteilte Daten entstehen, wenn die Summe von Millionen nicht gemessener Faktoren zu einem Ergebnis beiträgt. Exponential- und Weibull-Modelle sind umgekehrt Wahrscheinlichkeitsmodelle, die ausführlicher diskutiert wurden, als Lösungen für Differentialgleichungen für Martingale-Prozesse abgeleitet wurden und durch einfache Gefahrenfunktionen zusammengefasst werden.

Das Cox-Modell kümmert sich nicht um die Verteilung der Ausfallzeit. Es ist semiparametrisch und funktioniert daher für eine allgemeine Klasse parametrischer Modelle, sofern die Gefahren proportional sind. Das Cox-Modell verwendet eine partielle Wahrscheinlichkeit, um Risikosätze einzustufen: Gruppen von Personen, bei denen bei jedem Ergebnis ein Krankheitsrisiko besteht, und bewertet ein Wahrscheinlichkeitsverhältnis gemäß einer willkürlichen Grundlinien-Gefährdungsfunktion. Zensierte Beobachtungen werden einfach aus nachfolgenden Analysen entfernt. Die meisten sind sich einig, dass die Daten vollständig genutzt werden, während so wenig wie möglich davon ausgegangen wird, was die zugrunde liegende Verteilung ist / nicht ist.

AdamO
quelle
In welcher Beziehung steht das Tobit-Modell zum parametrischen Überlebensmodell? Entspricht das Tobit-Modell einem logarithmisch normalen parametrischen Überlebensmodell?
München