Intervallzensur

Ich habe eine Intervallzensur-Überlebenskurve mit R, JMP und SAS durchgeführt. Beide gaben mir identische Grafiken, aber die Tabellen unterschieden sich ein wenig. Dies ist die Tabelle, die JMP mir gegeben hat.

Start Time  End Time    Survival    Failure SurvStdErr
.            14.0000      1.0000     0.0000     0.0000
16.0000      21.0000      0.5000     0.5000     0.2485
28.0000      36.0000      0.5000     0.5000     0.2188
40.0000      59.0000      0.2000     0.8000     0.2828
59.0000      91.0000      0.2000     0.8000     0.1340
94.0000     .             0.0000     1.0000     0.0000

Dies ist die Tabelle, die SAS mir gegeben hat:

Obs Lower Upper Probability Cum Probability Survival Prob Std.Error
1    14    16      0.5          0.5             0.5        0.1581
2    21    28      0.0          0.5             0.5        0.1581
3    36    40      0.3          0.8             0.2        0.1265
4    91    94      0.2          1.0             0.0        0.0

R hatte eine kleinere Leistung. Das Diagramm war identisch und die Ausgabe war:

Interval (14,16] -> probability 0.5
Interval (36,40] -> probability 0.3
Interval (91,94] -> probability 0.2

Meine Probleme sind:

Ich verstehe die Unterschiede nicht
Ich weiß nicht, wie ich die Ergebnisse interpretieren soll ...
Ich verstehe die Logik hinter der Methode nicht.

Wenn Sie mir helfen könnten, insbesondere bei der Interpretation, wäre dies eine große Hilfe. Ich muss die Ergebnisse in ein paar Zeilen zusammenfassen und bin mir nicht sicher, wie ich die Tabellen lesen soll.

Ich sollte hinzufügen, dass die Stichprobe leider nur 10 Beobachtungen von Intervallen hatte, in denen Ereignisse auftraten. Ich wollte nicht die voreingenommene Mittelpunkt-Imputationsmethode verwenden. Aber ich habe zwei Intervalle von (2,16], und die erste Person, die nicht überlebt, ist mit 14 in der Analyse gescheitert, sodass ich nicht weiß, wie sie das tut, was sie tut.

Graph:

Geben Sie hier die Bildbeschreibung ein

r survival sas jmp interval-censoring user45442
quelle

Eigentlich Rund SASvöllig übereinstimmend: SASEnthält 4 Intervalle anstelle von 3, aber beachten Sie, dass sich die CDF in Intervall 2 nicht ändert! Tatsächlich JMPstimmen die Ergebnisse ebenfalls überein, sind jedoch etwas schwieriger zu verfolgen.

Cliff AB

Antworten:

Das wichtigste Thema hierbei ist das Verständnis der Zensur und welche Art in Ihrer Situation gilt. Verstehen Sie also für Ihre Probleme 1. und 3. den Kontext Ihres Problems. Auf diese Weise können Sie die geeignete Zensierungsmethode definieren.

Die R-Ausgabe besagt, dass sich die erste Gruppe von Fehlern im Intervall (14,16] befindet. Dies bedeutet nicht, dass der Fehler bei 14 aufgetreten ist. Dies bedeutet, dass R angenommen hat, dass die Daten rechtszensiert sind, was die häufigste Annahme ist für die Überlebensanalyse: Warum wird der Fehler als Bereich (14,16] angegeben und nicht nur als Wahrscheinlichkeit bei 16? Dies ist wahrscheinlich auf eine Konfidenzgrenzenschätzung zurückzuführen.

Interpretation des R-Ergebnisses, das SAS ähnlich ist: Die Ausfallwahrscheinlichkeit bei t = 16 beträgt 50%, bei t = 40 30%, bei t = 94 20%.

Vergessen Sie den Versuch, das Problem mithilfe von drei Analysepaketen zu verstehen. Wählen Sie eine aus, verstehen Sie die Optionen, die Sie für die Zensur festlegen können, und verwenden Sie sie. Ein guter Link für R: hier

Gary Chung
quelle

Der Kontext der Frage ist ein Rückfall einer Bedingung. Ich interessiere mich für die Zeit des Rückfalls. Leider finden die Nachuntersuchungen nicht täglich statt. Wenn also bei Besuch Nummer 4 der Rückfall aufgetreten ist, weiß ich nicht, wo er zwischen 3 (+ pro Tag) und 4 aufgetreten ist. Die Zensur ist richtig zensiert, und von 10 Beobachtungen wurde nur 1 als (94, unendlich) zensiert. Ist es richtig zu sagen, dass 50% mehr als 28 Tage überlebt haben?

user45442

und noch eine Frage: Wie effizient ist die Schätzung basierend auf 10 Beobachtungen, da die Intervallzensur auf unbekannten Daten basiert? Sind die Schätzungen wirklich besser als diejenigen, die ich auf voreingenommene Weise der Mittelpunktsimputation erhalten würde, bei der ich den Mittelwert jedes Intervalls nehme, um das Intervall darzustellen?

user45442

Ich würde nicht sagen, dass 50% 28 Tage oder länger überlebt haben, da Sie dies aus Gründen der Unsicherheit in dem von Ihnen genannten Intervall nicht wissen. Sie können sagen, dass 50% bis Tag 16 überlebt haben. In Bezug auf das Intervallproblem werfen Sie ein sehr reales Problem auf, das mit Datenungenauigkeiten zu tun hat. Die Verwendung einer Mittelpunkt-Imputationsmethode ist sinnvoll, aber der allgemein akzeptierte Ansatz für Ihre Situation ist die Kaplan-Meier-Schätzung .

Gary Chung

@ GaryChung: Sie ignorieren den Aspekt der Intervallzensierung dieser Daten vollständig .

Cliff AB