Ich habe gelesen, was Zensur ist und wie sie in der Überlebensanalyse berücksichtigt werden muss, aber ich würde gerne eine weniger mathematische Definition und eine intuitivere Definition hören (Bilder wären toll!). Kann mir jemand eine Erklärung zu 1) Zensur und 2) Auswirkungen wie Kaplan-Meier-Kurven und Cox-Regression geben?
13
Antworten:
Die Zensur wird häufig im Vergleich zur Kürzung beschrieben . Eine gute Beschreibung der beiden Prozesse liefern Gelman et al. (2005, S. 235):
Zensierung oder Kürzung kann für Werte oberhalb einer bestimmten Ebene (Rechtszensierung), unterhalb einer bestimmten Ebene (Linkszensierung) oder für beides auftreten.
Unten finden Sie ein Beispiel für eine Standardnormalverteilung, die bei Punkt (Mitte) zensiert oder bei 2.0 (rechts) abgeschnitten ist . Wenn die Stichprobe abgeschnitten ist, liegen keine Daten über dem Abschneidepunkt. Zensierte Stichprobenwerte über dem Abschneidepunkt werden auf den Grenzwert "gerundet", sodass sie in Ihrer Stichprobe überrepräsentiert sind.2,0 2,0
Intuitives Beispiel für eine Zensur ist, dass Sie Ihre Befragten nach ihrem Alter fragen, es jedoch nur bis zu einem bestimmten Wert aufzeichnen. Alle Altersstufen über diesem Wert, beispielsweise 60 Jahre, werden mit "60+" bewertet. Dies führt dazu, dass genaue Informationen für nicht zensierte Werte und keine Informationen über zensierte Werte vorliegen.
Nicht so typischen, realen Beispiel von Zensur wurde beobachtet polnischen matura Prüfungsergebnisse , die ziemlich viel Aufmerksamkeit im Internet gefangen . Die Prüfung wird am Ende der High School abgelegt und muss von den Schülern bestanden werden, um sich für eine höhere Ausbildung bewerben zu können. Können Sie anhand der folgenden Darstellung erraten, wie viele Punkte die Schüler mindestens benötigen, um die Prüfung zu bestehen? Es überrascht nicht, dass die "Lücke" in der ansonsten normalen Verteilung leicht "ausgefüllt" werden kann, wenn Sie einen geeigneten Bruchteil der überrepräsentierten Punktzahlen direkt über der Zensurgrenze nehmen.
Im Falle einer Überlebensanalyse
(Kleinbaum und Klein, 2005, S. 5). Beispielsweise behandeln Sie Patienten mit einem Medikament und beobachten sie bis zum Ende Ihrer Studie. Sie wissen jedoch nicht, was mit ihnen nach Abschluss der Studie passiert (gab es Rückfälle oder Nebenwirkungen?). Sie wissen nur, dass sie überlebte " zumindest bis zum Ende der Studie.
Nachfolgend finden Sie ein Beispiel für Daten, die aus einer Weibull-Verteilung generiert wurden, die mit dem Kaplan-Meier-Schätzer modelliert wurde. Die blaue Kurve markiert das auf dem gesamten Datensatz geschätzte Modell. Im mittleren Diagramm sehen Sie die zensierte Stichprobe und das auf den zensierten Daten geschätzte Modell (rote Kurve). Rechts sehen Sie die abgeschnittene Stichprobe und das auf dieser Stichprobe geschätzte Modell (rote Kurve). Wie Sie sehen, haben fehlende Daten (Kürzung) einen erheblichen Einfluss auf die Schätzungen, aber die Zensur kann mithilfe von Standardüberlebensanalysemodellen problemlos verwaltet werden.
Dies bedeutet nicht, dass Sie keine verkürzten Stichproben analysieren können. In solchen Fällen müssen Sie jedoch Modelle für fehlende Daten verwenden, die versuchen, die unbekannten Informationen zu "erraten".
Kleinbaum, DG und Klein, M. (2005). Überlebensanalyse: Ein selbstlernender Text. Springer.
Gelman, A., Carlin, JB, Stern, HS und Rubin, DB (2005). Bayesianische Datenanalyse. Chapman & Hall / CRC.
quelle
Die Zensur spielt eine zentrale Rolle bei der Überlebensanalyse.
Die Grundidee ist, dass Informationen zensiert werden und für Sie unsichtbar sind. Einfach ausgedrückt, wird eine zensierte Verteilung der Lebenszeiten erhalten, wenn Sie die Lebenszeiten aufzeichnen, bevor alle in der Stichprobe verstorben sind. Wenn Sie sich vorstellen, dass sich die Zeit auf der X-Achse "nach rechts" bewegt, kann dies als Rechtszensur bezeichnet werden.
Es gibt auch andere Arten: Linkszensur und Fensterzensur. Eine anleitende Einführung finden Sie beispielsweise in Allisons 1984 veröffentlichtem Text zur Ereignisverlaufsanalyse von Sage.
Beispiel: Wenn Sie die Scheidungsrate in der Bevölkerung berechnen, möchten Sie nur Personen einbeziehen, die vom Scheidungsrisiko bedroht sind (dh verheiratet sind). Wenn Menschen ihre Ehe aus anderen Gründen als der Scheidung (Verlust, Nichtigerklärung) beenden, möchten Sie sie zensieren. Sie sind nicht länger von einer Scheidung bedroht. Ihre Kaplan-Meier-Schätzungen (und Diagramme) sollten keine zensierten Beobachtungen nach dem Zeitpunkt enthalten, zu dem sie zensiert wurden, sondern sollten sie bis zu diesem Zeitpunkt enthalten.
quelle