Ich untersuche Trends (zwischen 1998 und 2011) der Sterblichkeitsraten bei Patienten mit Morbus Crohn. Jeder Patient (Fall) wurde in den Jahren 1998 bis 2011 eingeschlossen. Bei der Aufnahme wurde jeder Patient einer gesunden Kontrolle mit demselben Alter und Geschlecht zugeordnet. Ich analysiere Trends bei den Sterblichkeitsraten. Wenn ich dies direkt und ohne Anpassungen mache, erhalte ich im Laufe der Zeit schwankende Sterblichkeitsraten, was vermutlich darauf zurückzuführen ist, dass Personen, die ein bestimmtes Jahr eingeschlossen haben, nicht mit denen vergleichbar sind, die ein anderes Jahr enthalten. Daher möchte ich die Sterblichkeitsraten anpassen. Ich gehe davon aus, dass die Sterblichkeitsraten in beiden Gruppen (Fälle und Kontrollen) im Laufe der Zeit sinken und sich die Kluft zwischen Fällen und Kontrollen sukzessive verringern wird.
Meine Idee ist es, die Anpassung mittels Poisson-Regression vorzunehmen. Meine Daten sind auf individueller Ebene. Ich möchte eine Schätzung der Inzidenzrate (pro 1000 Personenjahre) für Fälle und Kontrollen jedes Jahr von 1998 bis 2011 erhalten. Die Überlebenszeit würde als Offset in das Modell aufgenommen. Etwas Ähnliches ist geschehen hier .
Ich habe die 200 ersten Zeilen aus meinem Datensatz angehängt, der aus 1500 Personen besteht. Hier sind die Daten . Variable Erklärung:
- tot = ob der Patient während der Nachsorge gestorben ist oder nicht
- Überleben = Überlebenszeit in Tagen
- Altersgruppe = kategorisierte Altersgruppe (4 Gruppen)
- Geschlecht = männlich / weiblich
- Diagnose = 0 für gesunde Kontrolle, 1 für Morbus Crohn
- Alter = Alter in Jahren
- Einschlussjahr = Jahr der Aufnahme in die Studie
Was habe ich bisher versucht? Ich habe versucht, Poisson-Modelle mit der Funktion glm () in R unter Verwendung einzelner Beobachtungen (log (Surv) als Offset) anzupassen, aber ich habe entweder einen Fehler erhalten oder konnte nicht herausfinden, wie die Anpassungen verwendet werden sollen. Ich habe die Daten auch in Gruppen zusammengefasst und dann die Todeszahlen in glm () analysiert. Wenn ich die Anpassung verwendete, um Inzidenzraten zu erhalten, konnte ich nur Raten für ein bestimmtes Alter / eine bestimmte Altersgruppe und ein bestimmtes Geschlecht erhalten (wie in der Funktion "dict ()" angegeben).
Ich würde mich sehr über statistische Ratschläge und Codierungsbeispiele freuen, die für den angehängten Datensatz durchgeführt werden können.
contrasts<-
(*tmp*
, value = contr.funs [1 + isOF [nn]]): Kontraste können nur auf Faktoren mit 2 oder mehr Ebenen angewendet werdendiagnosis*inclusion_year
Interaktionstermen einbeziehen . Wenn Sie nur das aktuelle Modell verwenden, unterscheidet sich die Fallnummer nur durch die Beta vondiagnosis
, die über Jahre konstant ist, da keine Interaktion zulässig ist. Danach werden die Vorhersagen nur noch Substitution sein. Ich bin nicht zu wählerisch, also würde ich nur das Durchschnittsalter und den mittleren Männeranteil unterschreiten.Antworten:
Ohne den Datensatz zu sehen (nicht verfügbar), scheint er größtenteils korrekt zu sein. Das Schöne an Poisson-Regressionen ist, dass sie bei Verwendung wie vorgeschlagen Raten liefern können. Beachten Sie möglicherweise, dass es zu einer Überdispersion kommen kann, bei der Sie zu einer negativen binomialen Regression wechseln sollten (siehe MASS-Paket).
Der Poisson-Regression ist es egal, ob die Daten aggregiert sind oder nicht, aber in der Praxis sind nicht aggregierte Daten schwach und können einige unerwartete Fehler verursachen. Beachten Sie, dass Sie
surv == 0
für keinen der Fälle haben können. Wenn ich getestet habe, sind die Schätzungen gleich:Wenn Sie eine Rate erhalten, ist es wichtig, die Variablen so zu zentrieren, dass der Achsenabschnitt interpretierbar ist, z.
Kann als Basisrate interpretiert werden und dann sind die Kovariaten Ratenverhältnisse. Wenn wir den Basiszinssatz nach 10 Jahren wollen:
Ich habe derzeit das Einschlussjahr als Trendvariable modelliert, aber Sie sollten wahrscheinlich nach Nichtlinearitäten suchen, und manchmal ist es nützlich, eine Kategorisierung der Zeitpunkte vorzunehmen. Ich habe diesen Ansatz in diesem Artikel verwendet:
D. Gordon, P. Gillgren, S. Eloranta, H. Olsson, M. Gordon, J. Hansson und KE Smedby -basierte Studie ”Melanoma Res., vol. 25, nein. 4, S. 348–356, August 2015.
quelle