In der Überlebensanalyse nehmen Sie an, dass die Überlebenszeit eines rv exponentiell verteilt ist. Wenn man bedenkt, dass ich jetzt "Ergebnisse" von iid rvs . Nur ein Teil dieser Ergebnisse ist tatsächlich "vollständig verwirklicht", dh die verbleibenden Beobachtungen sind noch "lebendig".x 1 , … , x n X i
Wenn ich eine ML-Schätzung für den Ratenparameter der Verteilung durchführen wollte, wie kann ich die nicht realisierten Beobachtungen auf kohärente / angemessene Weise nutzen? Ich glaube, sie enthalten noch nützliche Informationen für die Schätzung.
Könnte mich jemand zur Literatur zu diesem Thema führen? Ich bin sicher, dass es existiert. Ich habe jedoch Probleme, gute Keywords / Suchbegriffe für das Thema zu finden.
maximum-likelihood
references
survival
censoring
exponential-family
Guter Kerl Mike
quelle
quelle
Antworten:
Sie können die Parameter weiterhin schätzen, indem Sie die Wahrscheinlichkeit direkt verwenden. Die Beobachtungen seien mit der Exponentialverteilung mit der Rate λ > 0 und unbekannt. Die Dichtefunktion f ( x ; λ ) = λ e - λ x , kumulative Verteilungsfunktion F ( x ; λ ) = 1 - e - λ x und tail Funktion G ( x ; λx1, … , X.n λ > 0 f( X ; λ ) = λ e- λ x F.( x ; λ ) = 1 - e- λ x . Angenommen, die ersten r Beobachtungen sind vollständig beobachtet, währendwirfür x r + 1 , … , x n nur wissen, dass x j > t j für einige bekannte positive Konstanten t j ist . Wie immer ist die Wahrscheinlichkeit die "Wahrscheinlichkeit der beobachteten Daten" für die zensierten Beobachtungen, die durch P ( X j > t j) gegeben istG ( x ; λ ) = 1 - F.( x ; λ ) = e- λ x r xr + 1, … , X.n xj> tj tj , also ist die volle Wahrscheinlichkeitsfunktion
L ( λ ) = r ∏ i = 1 f ( x i ; λ ) ⋅ n ∏ i = r + 1 G ( t j ; λ )
Die Loglikelihood Funktion wird dann
l ( λ ) = r log λ - λ ( xP.( X.j> tj) = G ( tj;; λ )
Aber in jedem Fall ist die wirkliche Schlussfolgerung aus den Daten in diesem Fall, dass wir mehr Zeit warten sollten, bis wir einige Ereignisse erhalten ...
quelle