Eine Frage zur effektiven Stichprobengröße in Lebenstabellen

7

Ich studiere derzeit grundlegende Methoden der Überlebensanalyse und bin auf diesen seltsamen Schätzer der effektiven Stichprobengröße in einem bestimmten Intervall gestoßen. Für das j-te Intervall ist der Schätzer gegeben durchnj

nj=njcj2

Dabei ist die Anzahl der Personen, bei denen zu Beginn des j-ten Intervalls das Risiko eines Todes besteht, und die Anzahl der zensierten Überlebenszeiten. Der Schätzer wird unter der Annahme der Gleichmäßigkeit der zensierten Überlebenszeiten während des j-ten Intervalls verwendet.njcj

Meine Frage ist dann, wie ist dieser Schätzer gerechtfertigt? Warum nicht das einfachere und intuitivere ? Ich vermute, dass es ein Bias-Argument gibt, das genau wie im Fall der Stichprobenvarianz vorgebracht werden kann, aber ich konnte es noch nicht herausfinden.nj=njcj

Genauer gesagt, hier ist der genaue Auszug aus dem Buch über die Überlebensanalyse von Xian Liu:

Geben Sie hier die Bildbeschreibung ein

Jede Hilfe wird sehr geschätzt, danke.

JohnK
quelle

Antworten:

4

Beobachtungen, die innerhalb des betrachteten Intervalls zensiert wurden, sind für den gesamten Zeitraum nicht tödlich.

Sie zählen nicht als ganze Expositionsdauer einer Person, sondern nur den Bruchteil, dem sie ausgesetzt waren. Unter der Annahme der Einheitlichkeit sind sie im Durchschnitt eine halbe Periode ausgesetzt. Im Durchschnitt verliert jede der zensierten Personen eine halbe Expositionsdauer.cj

Der Text ist etwas umständlich formuliert, aber er behandelt die Personen, die im Durchschnitt die Hälfte des Zeitraums nicht waren, als gleichwertig mit der Hälfte der Personen, die zensiert wurden und in der Studie dem Todesrisiko nicht ausgesetzt waren (äquivalent, nicht in der Studie) - - Es ist die gleiche Anzahl von Personen-Expositionsperioden.cjcj

In der folgenden Abbildung sind zensierte Beobachtungen mit einem " o " gekennzeichnet, wenn zensierte und unzensierte Beobachtungen, die gestorben sind, mit einem " x beim Tod" gekennzeichnet sind. Die unzensierten zählen genauso, als ob es überhaupt keine Zensur gäbe, aber die zensierten haben eine geringere Exposition:

Geben Sie hier die Bildbeschreibung ein

Ich habe die zensierten Werte separat aufgeteilt und sie dann nach Belichtung sortiert. Wenn Sie die zensierten Werte mit kürzeren Expositionszeiten genommen haben, können Sie sie (im Durchschnitt) verwenden, um die Expositionszeit derjenigen mit längerer Exposition zu "füllen", so dass die Hälfte der zensierten Leben eine vollständige Exposition und die Hälfte keine hatte.

Das heißt, Sie verlieren im Durchschnitt Personen-Expositionsperioden, aber Sie könnten dies als gleichbedeutend damit ansehen, dass Sie einfach die Hälfte der zensierten Personen zu Beginn der Periode verlieren (und die andere Hälfte für die gesamte Periode exponiert ist), was sich verringert die Zählung durch .cj/2cj/2

Glen_b -State Monica
quelle
-1

Vielen Dank für diese Diskussion, ich bin auch zweifelhaft in Bezug auf diese Nennerkorrektur. Wenn Sie eine Rate schätzen, müssen Sie die Gesamtzeit berücksichtigen, die das Subjekt während eines bestimmten Zeitraums verbracht hat. Daher wird normalerweise davon ausgegangen, dass zensierte (und sterbende) Menschen durchschnittlich die Hälfte des Zeitraums gelebt haben. Dies ist jedoch nicht der Fall, wenn Sie eine bedingte Wahrscheinlichkeit schätzen, dh die Wahrscheinlichkeit, während des Zeitraums zu sterben, vorausgesetzt, ein Subjekt lebt zu Beginn des Zeitraums noch. In diesem Fall hat man auf dem Nenner die Anzahl der Subjekte, die in den Zeitraum eintreten. Warum in diesem Fall die Hälfte der Zensur korrigieren?

user167578
quelle
Ich glaube, Sie sollten dies als eine andere Frage ansprechen. Die Antwort ist ziemlich gut für die gestellte Frage. Sie werfen ein anderes Problem auf.
David Smith