Ich habe eine Intervallzensur-Überlebenskurve mit R, JMP und SAS durchgeführt. Beide gaben mir identische Grafiken, aber die Tabellen unterschieden sich ein wenig. Dies ist die Tabelle, die JMP mir gegeben hat.
Start Time End Time Survival Failure SurvStdErr
. 14.0000 1.0000 0.0000 0.0000
16.0000 21.0000 0.5000 0.5000 0.2485
28.0000 36.0000 0.5000 0.5000 0.2188
40.0000 59.0000 0.2000 0.8000 0.2828
59.0000 91.0000 0.2000 0.8000 0.1340
94.0000 . 0.0000 1.0000 0.0000
Dies ist die Tabelle, die SAS mir gegeben hat:
Obs Lower Upper Probability Cum Probability Survival Prob Std.Error
1 14 16 0.5 0.5 0.5 0.1581
2 21 28 0.0 0.5 0.5 0.1581
3 36 40 0.3 0.8 0.2 0.1265
4 91 94 0.2 1.0 0.0 0.0
R hatte eine kleinere Leistung. Das Diagramm war identisch und die Ausgabe war:
Interval (14,16] -> probability 0.5
Interval (36,40] -> probability 0.3
Interval (91,94] -> probability 0.2
Meine Probleme sind:
- Ich verstehe die Unterschiede nicht
- Ich weiß nicht, wie ich die Ergebnisse interpretieren soll ...
- Ich verstehe die Logik hinter der Methode nicht.
Wenn Sie mir helfen könnten, insbesondere bei der Interpretation, wäre dies eine große Hilfe. Ich muss die Ergebnisse in ein paar Zeilen zusammenfassen und bin mir nicht sicher, wie ich die Tabellen lesen soll.
Ich sollte hinzufügen, dass die Stichprobe leider nur 10 Beobachtungen von Intervallen hatte, in denen Ereignisse auftraten. Ich wollte nicht die voreingenommene Mittelpunkt-Imputationsmethode verwenden. Aber ich habe zwei Intervalle von (2,16], und die erste Person, die nicht überlebt, ist mit 14 in der Analyse gescheitert, sodass ich nicht weiß, wie sie das tut, was sie tut.
Graph:
R
undSAS
völlig übereinstimmend:SAS
Enthält 4 Intervalle anstelle von 3, aber beachten Sie, dass sich die CDF in Intervall 2 nicht ändert! TatsächlichJMP
stimmen die Ergebnisse ebenfalls überein, sind jedoch etwas schwieriger zu verfolgen.Antworten:
Das wichtigste Thema hierbei ist das Verständnis der Zensur und welche Art in Ihrer Situation gilt. Verstehen Sie also für Ihre Probleme 1. und 3. den Kontext Ihres Problems. Auf diese Weise können Sie die geeignete Zensierungsmethode definieren.
Die R-Ausgabe besagt, dass sich die erste Gruppe von Fehlern im Intervall (14,16] befindet. Dies bedeutet nicht, dass der Fehler bei 14 aufgetreten ist. Dies bedeutet, dass R angenommen hat, dass die Daten rechtszensiert sind, was die häufigste Annahme ist für die Überlebensanalyse: Warum wird der Fehler als Bereich (14,16] angegeben und nicht nur als Wahrscheinlichkeit bei 16? Dies ist wahrscheinlich auf eine Konfidenzgrenzenschätzung zurückzuführen.
Interpretation des R-Ergebnisses, das SAS ähnlich ist: Die Ausfallwahrscheinlichkeit bei t = 16 beträgt 50%, bei t = 40 30%, bei t = 94 20%.
Vergessen Sie den Versuch, das Problem mithilfe von drei Analysepaketen zu verstehen. Wählen Sie eine aus, verstehen Sie die Optionen, die Sie für die Zensur festlegen können, und verwenden Sie sie. Ein guter Link für R: hier
quelle