Inzidenzraten vergleichen

9

Ich möchte die Inzidenzraten zwischen zwei Gruppen vergleichen (eine ohne Krankheit und eine mit).

Ich hatte vor, das Inzidenzratenverhältnis (IRR), dh die Inzidenzratengruppe B / Inzidenzratengruppe A, zu berechnen und dann zu testen, ob diese Rate gleich 1 ist, und schließlich 95% CI-Intervalle für die IRR zu berechnen.

Ich habe in einem Buch (Rosner's Fundamentals of Biostatistics ) eine Methode zur Berechnung des 95% CI gefunden :

exp[log(IRR)±1.96(1/a1)+(1/a2)]

Dabei sind und die Anzahl der Ereignisse. Aber diese Annäherung gilt nur für ausreichend große Stichprobengrößen und ich denke, die Anzahl der Ereignisse, die ich habe, ist zu klein (vielleicht ist es für den Gesamtvergleich in Ordnung.)a1a2

Ich denke, ich sollte eine andere Methode anwenden.

Ich benutze R und das genaue Paket und fand, dass ich vielleicht verwenden könnte poisson.test(). Diese Funktion verfügt jedoch über drei Methoden zum Definieren der zweiseitigen p-Werte: zentral, minartig und blaker.

Also meine Fragen sind:

  1. Ist es richtig, zwei Inzidenzratenverhältnisse zu vergleichen, indem ich einen Test zum Vergleichen der Poissonraten verwende?

  2. Wenn Sie die Funktion poisson.test in R aus dem genau-Paket verwenden, welche Methode ist die beste?

Die Vignette für genaue Angaben lautet:

zentral: ist das 2-fache des Minimums der oben durch 1 begrenzten einseitigen p-Werte. Der Name 'zentral' wird durch die zugehörigen Inversionskonferenzintervalle motiviert, die zentrale Intervalle sind, dh sie garantieren, dass der wahre Parameter kleiner als ist Wahrscheinlichkeit, kleiner (mehr) als der untere (obere) Schwanz des 100 (1- )% -Konfidenzintervalls zu sein. Dies wird von Hirji (2006) als TST (Double the Small Tail Method) bezeichnet.αα/2α

minlike: ist die Summe der Wahrscheinlichkeiten von Ergebnissen mit Wahrscheinlichkeiten, die kleiner oder gleich der beobachteten Wahrscheinlichkeit sind. Dies wird von Hirji (2006) als PB-Methode (Wahrscheinlichkeitsmethode) bezeichnet.

Blaker: Kombiniert die Wahrscheinlichkeit des kleineren beobachteten Schwanzes mit der kleinsten Wahrscheinlichkeit des gegenüberliegenden Schwanzes, die diese beobachtete Schwanzwahrscheinlichkeit nicht überschreitet. Der Name 'Blaker' wurde von Blaker (2000) motiviert, der die zugehörige Methode für Konfidenzintervalle umfassend untersucht. Dies wird von Hirji (2006) als CT-Methode (Combined Tail) bezeichnet.

Meine Daten sind:

Group A: 
Age group 1: 3 cases    in 10459 person yrs.   Incidence rate: 0.29 
Age group 2: 7 cases    in 2279 person yrs.    Incidence rate: 3.07
Age group 3: 4 cases    in 1990 person yrs.    Incidence rate: 2.01
Age group 4: 9 cases    in 1618 person yrs.    Incidence rate: 5.56
Age group 5: 11 cases   in 1357 person yrs.    Incidence rate: 8.11
Age group 6: 11 cases   in 1090 person yrs.    Incidence rate: 10.09
Age group 7: 9 cases    in 819 person yrs.     Incidence rate: 10.99
  Total:    54 cases in 19612 person yrs.      Incidence rate: 2.75

Group B: 
Age group 1: 3 cases    in 3088 person yrs.   Incidence rate: 0.97 
Age group 2: 1 cases    in 707 person yrs.    Incidence rate: 1.41
Age group 3: 2 cases    in 630 person yrs.    Incidence rate: 3.17
Age group 4: 6 cases    in 441 person yrs.    Incidence rate: 13.59
Age group 5: 10 cases   in 365 person yrs.    Incidence rate: 27.4
Age group 6: 6 cases   in 249 person yrs.    Incidence rate: 24.06
Age group 7: 0 cases    in 116 person yrs.     Incidence rate: 0
  Total:    28 cases in 5597 person yrs.      Incidence rate: 5.0
Edwin
quelle

Antworten:

2

Ein paar Gedanken:

Erstens ist Ihr vorgeschlagener Vergleich - das Incident Rate Ratio zwischen A und B - derzeit nicht von Kovariaten abhängig. Dies bedeutet, dass Ihre Anzahl von Ereignissen 54 für Gruppe A und 28 für Gruppe B beträgt. Dies ist mehr als genug, um mit den üblichen Konfidenzintervallmethoden auf der Basis großer Stichproben zu arbeiten.

Zweitens, selbst wenn Sie beabsichtigen, den Effekt des Alters anzupassen, anstatt das Verhältnis für jede Gruppe zu berechnen, könnten Sie besser mit einem Regressionsansatz bedient werden. Wenn Sie nach mehreren Ebenen einer Variablen schichten, wird dies im Vergleich zu einer Regressionsgleichung, die Ihnen das Verhältnis der Raten von A und B bei der Steuerung des Alters ergibt, im Allgemeinen ziemlich umständlich. Ich glaube, die Standardansätze funktionieren immer noch für Ihre Stichprobengröße. Wenn Sie sich darüber Sorgen machen, können Sie auch etwas wie glmperm verwenden .

Fomite
quelle
1

Die Inzidenzrate jeder Gruppe in Ihren Daten ist nur der Mittelwert einer Summe unabhängiger Bernoulli (0/1) -Variablen. Jeder Patient hat eine eigene Variable, die einen Wert von 0 oder 1 erhält. Sie summieren sie und nehmen den Mittelwert, der ist die Inzidenzrate.

Bei großen Stichproben (und Ihre Stichprobe ist groß) wird der Mittelwert normal verteilt, sodass Sie mit einem einfachen Z-Test testen können, ob die beiden Raten unterschiedlich sind oder nicht.

Schauen Sie sich in R prop.test an: http://stat.ethz.ch/R-manual/R-patched/library/stats/html/prop.test.html

Wenn Sie die Daten vollständig nutzen möchten, versuchen Sie festzustellen, ob die Verteilung der Inzidenzraten zwischen Gruppe A und B unterschiedlich ist. Dazu kann ein Unabhängigkeitstest durchgeführt werden, z. B. ein Chi-Quadrat eines G. -Test: http://udel.edu/~mcdonald/statchiind.html

Ron
quelle
0

Der einzige Weg, um sicherzugehen, dass die Stichprobe groß genug ist (oder wie Charlie Geyer es ausdrücken würde - dass Sie sich tatsächlich in einem Asymtopieland befinden ), besteht darin, viele Monte-Carlo-Simulationen durchzuführen oder, wie EpiGard vorgeschlagen hat, etwas wie glmperm zu verwenden.

Welche Methode genau am besten ist, gibt es hier nicht am besten - oder wie Fisher es früher ausdrückte

Am besten für was?

Michael Fay bietet eine Klarstellung hier

Phaneron
quelle