Ich versuche, eine Vorstellung von jeder der Hauptfunktionen in der Aktuarwissenschaft zu bekommen (speziell für das Cox Proportional Hazards Model). Folgendes habe ich bisher:
- : Beginnend mit der Startzeit die Wahrscheinlichkeitsverteilung, wann Sie sterben werden.
- : nur die kumulative Verteilung. Wie viel Prozent der Bevölkerung werden zum Zeitpunkt tot sein?
- : . Wie viel Prozent der Bevölkerung werden zum Zeitpunkt am Leben sein?
- : Gefahrenfunktion. Zu einem gegebenen Zeitpunkt der noch lebenden Personen kann dies verwendet werden, um abzuschätzen, wie viele Personen in dem nächsten Zeitintervall sterben werden, oder, wenn das Intervall> 0 ist, die Wahrscheinlichkeit des sofortigen Todes.
- : kumulative Gefahr. Keine Ahnung.
Welche Idee steckt dahinter, Gefahrenwerte zu kombinieren, insbesondere wenn sie kontinuierlich sind? Wenn wir ein diskretes Beispiel mit Sterblichkeitsraten über vier Jahreszeiten verwenden und die Hazard-Funktion wie folgt lautet:
- Ab dem Frühjahr sind alle am Leben und 20% sterben
- Jetzt im Sommer werden von den verbleibenden 50% sterben
- Jetzt im Herbst werden von den verbleibenden 75% sterben
- Die letzte Jahreszeit ist der Winter. Von den verbleibenden sterben 100%
Dann ist das kumulative Risiko 20%, 70%, 145%, 245% ?? Was bedeutet das und warum ist das nützlich?
Antworten:
Das Kombinieren von Anteilen, die wie Sie sterben, birgt keine kumulative Gefahr für Sie. Die Gefährdungsrate in kontinuierlicher Zeit ist eine bedingte Wahrscheinlichkeit, dass in einem sehr kurzen Intervall ein Ereignis eintritt:
Die kumulative Gefährdung ist die Integration der (augenblicklichen) Gefährdungsrate über Alter / Zeit. Es ist wie das Aufsummieren von Wahrscheinlichkeiten, aber da sehr klein ist, sind diese Wahrscheinlichkeiten auch kleine Zahlen (z. B. kann die Sterberate im Alter von etwa 30 Jahren bei etwa 0,004 liegen). Die Gefährdungsrate hängt davon ab, dass das Ereignis nicht vor eingetreten ist. Für eine Population kann es sich also über 1 summieren.Δ t t
Sie können eine Sterbetafel für Menschen nachschlagen, obwohl dies eine diskrete Zeitformulierung ist, und versuchen, zu akkumulieren .mx
Wenn Sie R verwenden, ist hier ein kleines Beispiel für die Annäherung dieser Funktionen an die Anzahl der Todesfälle in jedem 1-Jahres-Altersintervall:
Hoffe das hilft.
quelle
Das Buch "Eine Einführung in die Überlebensanalyse mit Stata" (2. Auflage) von Mario Cleves enthält ein gutes Kapitel zu diesem Thema.
Sie finden das Kapitel auf Google Bücher , S. 13-15. Aber ich würde raten, das ganze Kapitel 2 zu lesen.
Hier ist die Kurzform:
quelle
Ich könnte vermuten, dass es aufgrund seiner Verwendung in Diagnoseplots bemerkenswert ist:
(1) In dem Cox-Proportional-Hazards-Modell ist , wobei und die Koeffizienten- bzw. Kovariatenvektoren sind. ist die Basislinien-Gefahrenfunktion; & so ist . Wenn Sie die Schätzung gegen zeichnen, folgen verschiedene Kovariatenmuster parallelen Kurven, vorausgesetzt, die Proportionalitätsannahme ist korrekt.β Z h 0 ( x ) log H ( x ) = β T z + H 0 ( x ) log H ( x ) xh ( x ) = eβTzh0( x ) β z h0( x ) LogH( x ) = βTz+ H0( x ) LogH^( x ) x
(2) Im Weibull-Modell ist , wobei & sind die Skalierungs- und Formparameter; & so . Wenn Sie die Schätzung gegen plotten , erhalten Sie eine gerade Linie mit Steigung & Achsenabschnitt vorausgesetzt, die Weibull-Annahme ist korrekt. Und natürlich deutet eine Steigung nahe 1 darauf hin, dass ein Exponentialmodell passen könnte.θαlogH(x)=αlogx-αlogθlogH(x)logxα-αlogθh ( x ) = αθ( xθ)α - 1 θ α LogH( x ) = α logx - α logθ LogH^( x ) Logx α^ - α^Logθ^
Eine intuitive Interpretation von ist die erwartete Anzahl von Todesfällen eines Individuums bis zum Zeitpunkt wenn das Individuum nach jedem Tod auferstehen würde (ohne die Zeit auf Null zurückzusetzen).xH( x ) x
quelle
In Umschreibung dessen, was @Scortchi sagt, möchte ich betonen, dass die kumulative Hazard-Funktion keine gute Interpretation hat, und als solche würde ich nicht versuchen, sie als Methode zur Interpretation der Ergebnisse zu verwenden. Wenn Sie einem nicht-statistischen Forscher mitteilen, dass die kumulativen Gefahren unterschiedlich sind, erhalten Sie höchstwahrscheinlich eine "mm-hm" -Antwort. Dann werden Sie nie wieder und nicht in angemessener Weise nach dem Thema fragen.
Die kumulative Gefährdungsfunktion erweist sich jedoch mathematisch als sehr nützlich, z. B. als allgemeine Möglichkeit, die Gefährdungsfunktion und die Überlebensfunktion zu verknüpfen. Daher ist es wichtig zu wissen, wie hoch das kumulative Risiko ist und wie es für verschiedene statistische Methoden verwendet werden kann. Im Allgemeinen halte ich es jedoch nicht für besonders nützlich, über reale Daten in Bezug auf kumulative Gefahren nachzudenken.
quelle