Während eines Statistikkurses für Medizinstudenten stieß ich auf ein Problem im Zusammenhang mit Inzidenzraten. Der Kontext des Problems ist ein Kapitel über die Poisson-Verteilung. In dem Problem werden 2300 Raucher über einen Zeitraum von 1 Jahr beobachtet, in dem 24 von ihnen Lungenkrebs entwickeln. Sie möchten dann die Inzidenzrate des Prozesses berechnen und wie folgt vorgehen:
Zuerst verstand ich nicht, warum sie subtrahierten , aber ich nahm an, dass dies eine Korrektur für die Tatsache war, dass diese 24 Personen, da sie im Laufe des Jahres an Krebs erkranken, eine kürzere Risikodauer haben als diejenigen, die sich nicht entwickeln die Krankheit. Im Lehrbuch selbst wurden keine weiteren Informationen angegeben, zumindest nicht im Problem. Eine schnelle Suche bestätigte, dass ich in die richtige Richtung denke.
Aber ich verstehe die Gründe für die Formel immer noch nicht. Kann mich jemand aufklären? Auch wenn einige Referenzen für Medizinstudenten zugänglich sein könnten. Es macht mir nichts aus, auch technischere Referenzen zu haben.
quelle
Antworten:
Ich schlage vor, das Auftreten von Krebs als Poisson-Prozess zu modellieren. Während des Beobachtungszeitraums sind innerhalb eines Individuums mehrere Ereignisse (Auftreten von Tumoren) möglich. Wenn die Rate des Auftretens von Tumoren pro Jahr ist, ist die Wahrscheinlichkeit von 0 Ereignissen und die Wahrscheinlichkeit von 1 Ereignis oder mehr ist .e - λ p = 1 - e - λλ e- λ p = 1 - e- λ
Sie folgen Personen während eines Jahres. Die Anzahl der Personen mit einem oder mehreren Ereignissen beträgt . Die erwartete Anzahl ist .X ∼ B i n ( n , p ) E ( X ) = n p = n ( 1 - e - λ )n X.∼ B i n ( n , p ) E.( X.) = n p = n ( 1 - e- λ)
Jetzt beobachten Sie Ereignisse und möchten schätzen . Schätzen Sie zuerst , dann . Durch die Invarianz von Maximum-Likelihood-Schätzern ist die MLE von .λ p = xx λ λ =-log(1-xp^=xn & lgr;& lgr;λ^=−log(1−xn)≈xn+x22n2 λ^ λ
Ihr Schätzer ist . Der Unterschied zwischen den beiden Schätzern beträgt ungefähr , was sehr klein ist, wenn klein ist. Ich denke, dies liefert eine Rechtfertigung, auch wenn eine andere Modellierung möglicherweise direkt zu Ihrem Schätzer führen könnte. x3/6n3x/nx/n1−x/2n≈xn+x22n2 x3/6n3 x/n
quelle
Unter der Annahme, dass die Krebsdiagnosen gleichmäßig über das Jahr verteilt sind, sind die diagnostizierten Personen dem Risiko ausgesetzt, (durchschnittlich) ein halbes Jahr vor dieser Diagnose diagnostiziert zu werden.
Ihr Link erwähnt die Annahme des Auftretens zur Hälfte des Beobachtungszeitraums, aber nicht, woher es kommt - was nur die Annahme der Einheitlichkeit ist. Diese Annahme ist nicht immer vernünftig, und es gibt Zeiten, in denen sie einen wesentlichen Unterschied machen kann. Ich würde empfehlen, die Annahme jedes Mal zu kennen, wenn Sie die Formel verwenden, da Sie ihre Eignung prüfen sollten und wenn sie nicht geeignet ist, ob sie wahrscheinlich einen wesentlichen Einfluss auf die Schätzung hat (in diesem Fall eine bessere Annahme) über das Vorkommen sollte untersucht werden)
quelle