Intuition hinter der Hazard Rate

16

Ich bin verwirrt über die Gleichung, die als Definition der Gefährdungsrate dient. Ich habe eine Vorstellung davon, wie hoch die Gefährdungsrate ist, verstehe aber nicht, wie die Gleichung diese Intuition ausdrückt.

Wenn x eine Zufallsvariable ist, die den Zeitpunkt des Todes einer Person in einem Zeitintervall darstellt [0,T] . Dann ist die Gefährdungsrate:

h(x)=f(x)1F(x)

Wo F(x) die Wahrscheinlichkeit des Todes bis zu dem Zeitpunkt darstellt , repräsentiert die Wahrscheinlichkeit, dass bis zu dem Zeitpunkt überlebte bis , und ist die Wahrscheinlichkeit des Todes am Punkt .x[0,T]
1F(x)x[0,T]
f(x)x

Wie erklärt die Division von durch die Überlebensrate die Intuition der Wahrscheinlichkeit des sofortigen Todes im nächsten ? Sollte es nicht einfach , was die Berechnung der Gefahrenrate trivial macht?f(x)Δtf(x)

user246315
quelle

Antworten:

11

Lassen Sie den Zeitpunkt des Todes angeben (oder den Zeitpunkt des Scheiterns, wenn Sie eine weniger krankhafte Beschreibung bevorzugen). Angenommen, X ist eine kontinuierliche Zufallsvariable, deren Dichtefunktion f ( t ) nur für ( 0 , ) ungleich Null ist . Nun bemerkt, dass es muß der Fall sein , dass f ( t ) zerfällt weg 0 als t , denn wenn f ( t ) nicht Zerfall weg wie gesagt, dann - fXXf(t)(0,)f(t)0tf(t) kann nicht halten. Ihre Vorstellung, dassf(T)die Wahrscheinlichkeit des Todes zum ZeitpunktT ist (tatsächlich ist esf(T)& Dgr;t, das (ungefähr) die Wahrscheinlichkeit des Todes in demkurzenIntervall(T,T+& Dgr;t) von ist) LängeΔt) führt zu unplausiblen und unglaublichen Schlussfolgerungen wief(t)dt=1f(T)Tf(T)Δt(T,T+Δt]Δt

Es ist wahrscheinlicher, dass Sie innerhalb des nächsten Monats sterben, wenn Sie dreißig Jahre alt sind, als wenn Sie achtundneunzig Jahre alt sind.

wann immer ist, dass f ( 30 ) > f ( 98 ) .f(t)f(30)>f(98)

Der Grund , warum (oder f ( T ) Δ t ) ist die „falsche“ Wahrscheinlichkeit zu sehen ist , dass der Wert von f ( T ) von Interesse ist nur für diejenigen, die am Leben im Alter von T (und immer noch geistig wachsam genug, um Statistiken zu lesen.SE regelmäßig!) Was man sich ansehen sollte, ist die Wahrscheinlichkeit , dass ein T- jähriger innerhalb des nächsten Monats stirbt, das heißt,f(T)f(T)Δtf(T)TT

P{(X(T,T+Δt]XT}=P{(X(T,T+Δt])(XT)}P{XT} definition of conditional probability=P{X(T,T+Δt]}P{XT}=f(T)Δt1F(T)because X is a continuous rv

Die Wahl vierzehn Tage, eine Woche, ein Tag, eine Stunde zu sein, eine Minute, etc. , die wir zu dem Schluss gekommen , dass die (momentane) Hazardrate für ein T alt ist -JahrΔtT

h(T)=f(T)1F(T)

in dem Sinne, dass die ungefähre Wahrscheinlichkeit des Todes in der nächsten Femtosekunde Dgr ; t ) eines T- jährigen f ( T ) & Dgr; t ist(Δt)Tf(T)Δt1F(T).

Note that in contrast to the density f(t) integrating to 1, the integral 0h(t)dt must diverge. This is because the CDF F(t) is related to the hazard rate through

F(t)=1exp(0th(τ)dτ)
limtF(t)=1
limt0th(τ)dτ=,

Typical hazard rates are increasing functions of time, but constant hazard rates (exponential lifetimes) are possible. Both of these kinds of hazard rates obviously have divergent integrals. A less common scenario (for those who believe that things improve with age, like fine wine does) is a hazard rate that decreases with time but slowly enough that the integral diverges.

Dilip Sarwate
quelle
"Lassen Sie X den Zeitpunkt des Todes
angeben
10

Stellen Sie sich vor, Sie interessieren sich für die Inzidenz der (Erst-) Heirat bei Männern. Um die Häufigkeit der Heirat im Alter von 20 Jahren zu untersuchen, wählen Sie eine Stichprobe von Personen aus, die in diesem Alter nicht verheiratet sind, und prüfen, ob sie im nächsten Jahr heiraten (bevor sie 21 werden).

Das könnte man grob einschätzen

P(marrybefore21|notmarriedat20)
as the proportion of individuals who got married from your sample of single 20 year olds, i.e.
N(marriedbefore21andnotmarriedat20)N(notmarriedat20)

So basically this is just using the definition of conditional probability,

P(X|Y)=P(X,Y)P(Y).
Now imagine we make the age unit smaller and smaller, up to days for example. I.e. what is the incidence of marriage at age of 7300 days? Then you would do the same, but survey all individuals of 7300 days and look who gets married before the end of the day. If T is a random variable age at marriage, then we could write
P(T7301)|T7300)=P(T[7300,7301))P(T7300)
by the same logic as before.

The hazard would then be the instantaneous probability of marriage at age t, for a non-married individual. We can write this as

h(t)dt=P(T[t,t+dt)|Tt)=P(T[t,t+dt))P(Tt)
Theodor
quelle
5

f(x) is not the probability of death, but the probability density; the expected number of times you die within the next unit of time if the probability density remained constant during that unit of time.

Notice there is a problem: your probability of dying when you already died before is rather problematic. So it makes more sense to compute the probability of dying conditional on having survived thus far. 1F(t) it the probability of having survived until t, so dividing the probabilty density by that probability, will get us the expected number of times we will die within the next unit of time conditional on not having died before. That is the hazard rate.

Maarten Buis
quelle