Laymans Erklärung der Zensur in der Überlebensanalyse

13

Ich habe gelesen, was Zensur ist und wie sie in der Überlebensanalyse berücksichtigt werden muss, aber ich würde gerne eine weniger mathematische Definition und eine intuitivere Definition hören (Bilder wären toll!). Kann mir jemand eine Erklärung zu 1) Zensur und 2) Auswirkungen wie Kaplan-Meier-Kurven und Cox-Regression geben?

RustyStatistician
quelle
Ich schlage vor, den Podcast " Linearer Exkurs" zur Überlebensanalyse anzuhören und ihre vereinfachte Definition der linken und rechten Zensur und die Motivation für das Cox-Modell zu hören.
Uri Goren

Antworten:

16

Die Zensur wird häufig im Vergleich zur Kürzung beschrieben . Eine gute Beschreibung der beiden Prozesse liefern Gelman et al. (2005, S. 235):

Verkürzte Daten unterscheiden sich von zensierten Daten dadurch, dass keine Anzahl von Beobachtungen über den Kürzungspunkt hinaus verfügbar ist. Beim Zensieren gehen die Werte von Beobachtungen über den Trunkierungspunkt hinaus verloren, aber ihre Anzahl wird eingehalten.

Zensierung oder Kürzung kann für Werte oberhalb einer bestimmten Ebene (Rechtszensierung), unterhalb einer bestimmten Ebene (Linkszensierung) oder für beides auftreten.

Unten finden Sie ein Beispiel für eine Standardnormalverteilung, die bei Punkt (Mitte) zensiert oder bei 2.0 (rechts) abgeschnitten ist . Wenn die Stichprobe abgeschnitten ist, liegen keine Daten über dem Abschneidepunkt. Zensierte Stichprobenwerte über dem Abschneidepunkt werden auf den Grenzwert "gerundet", sodass sie in Ihrer Stichprobe überrepräsentiert sind.2,02,0

Bildbeschreibung hier eingeben

Intuitives Beispiel für eine Zensur ist, dass Sie Ihre Befragten nach ihrem Alter fragen, es jedoch nur bis zu einem bestimmten Wert aufzeichnen. Alle Altersstufen über diesem Wert, beispielsweise 60 Jahre, werden mit "60+" bewertet. Dies führt dazu, dass genaue Informationen für nicht zensierte Werte und keine Informationen über zensierte Werte vorliegen.

Nicht so typischen, realen Beispiel von Zensur wurde beobachtet polnischen matura Prüfungsergebnisse , die ziemlich viel Aufmerksamkeit im Internet gefangen . Die Prüfung wird am Ende der High School abgelegt und muss von den Schülern bestanden werden, um sich für eine höhere Ausbildung bewerben zu können. Können Sie anhand der folgenden Darstellung erraten, wie viele Punkte die Schüler mindestens benötigen, um die Prüfung zu bestehen? Es überrascht nicht, dass die "Lücke" in der ansonsten normalen Verteilung leicht "ausgefüllt" werden kann, wenn Sie einen geeigneten Bruchteil der überrepräsentierten Punktzahlen direkt über der Zensurgrenze nehmen.

Bildbeschreibung hier eingeben

Im Falle einer Überlebensanalyse

Zensur tritt auf, wenn wir einige Informationen über die individuelle Überlebenszeit haben, aber die Überlebenszeit nicht genau kennen

(Kleinbaum und Klein, 2005, S. 5). Beispielsweise behandeln Sie Patienten mit einem Medikament und beobachten sie bis zum Ende Ihrer Studie. Sie wissen jedoch nicht, was mit ihnen nach Abschluss der Studie passiert (gab es Rückfälle oder Nebenwirkungen?). Sie wissen nur, dass sie überlebte " zumindest bis zum Ende der Studie.

Nachfolgend finden Sie ein Beispiel für Daten, die aus einer Weibull-Verteilung generiert wurden, die mit dem Kaplan-Meier-Schätzer modelliert wurde. Die blaue Kurve markiert das auf dem gesamten Datensatz geschätzte Modell. Im mittleren Diagramm sehen Sie die zensierte Stichprobe und das auf den zensierten Daten geschätzte Modell (rote Kurve). Rechts sehen Sie die abgeschnittene Stichprobe und das auf dieser Stichprobe geschätzte Modell (rote Kurve). Wie Sie sehen, haben fehlende Daten (Kürzung) einen erheblichen Einfluss auf die Schätzungen, aber die Zensur kann mithilfe von Standardüberlebensanalysemodellen problemlos verwaltet werden.

Bildbeschreibung hier eingeben

Dies bedeutet nicht, dass Sie keine verkürzten Stichproben analysieren können. In solchen Fällen müssen Sie jedoch Modelle für fehlende Daten verwenden, die versuchen, die unbekannten Informationen zu "erraten".


Kleinbaum, DG und Klein, M. (2005). Überlebensanalyse: Ein selbstlernender Text. Springer.

Gelman, A., Carlin, JB, Stern, HS und Rubin, DB (2005). Bayesianische Datenanalyse. Chapman & Hall / CRC.

Tim
quelle
Wissen Sie, woher diese Matura-Handlung kommt? Ich habe versucht zu googeln und erhalte weiterhin den reddit-Link, aber dieser enthält keine Referenzen. Es führt nur zu imgur.com ohne Namensnennung. UPDATE: Habe es gefunden. cke.edu.pl//images/files/matura/informacje_o_wynikach/2013/… Seite 18.
Amöbe sagt Reinstate Monica
1
@amoeba Wenn Sie an weiteren Details interessiert waren, können Sie mich gerne kontaktieren. Die meisten Materialien zu diesem Thema, die ich kenne, sind leider in polnischer Sprache. Das Bild ist eine Sache, aber ein Freund von mir hat diese Daten genauer analysiert (übrigens ist es auf Anfrage erhältlich).
Tim
2

Die Zensur spielt eine zentrale Rolle bei der Überlebensanalyse.

Die Grundidee ist, dass Informationen zensiert werden und für Sie unsichtbar sind. Einfach ausgedrückt, wird eine zensierte Verteilung der Lebenszeiten erhalten, wenn Sie die Lebenszeiten aufzeichnen, bevor alle in der Stichprobe verstorben sind. Wenn Sie sich vorstellen, dass sich die Zeit auf der X-Achse "nach rechts" bewegt, kann dies als Rechtszensur bezeichnet werden.

Es gibt auch andere Arten: Linkszensur und Fensterzensur. Eine anleitende Einführung finden Sie beispielsweise in Allisons 1984 veröffentlichtem Text zur Ereignisverlaufsanalyse von Sage.

Beispiel: Wenn Sie die Scheidungsrate in der Bevölkerung berechnen, möchten Sie nur Personen einbeziehen, die vom Scheidungsrisiko bedroht sind (dh verheiratet sind). Wenn Menschen ihre Ehe aus anderen Gründen als der Scheidung (Verlust, Nichtigerklärung) beenden, möchten Sie sie zensieren. Sie sind nicht länger von einer Scheidung bedroht. Ihre Kaplan-Meier-Schätzungen (und Diagramme) sollten keine zensierten Beobachtungen nach dem Zeitpunkt enthalten, zu dem sie zensiert wurden, sondern sollten sie bis zu diesem Zeitpunkt enthalten.

Torkildl
quelle
Grafiken oder Grundstücke?
RustyStatistician