Wie erklären Sie den Unterschied zwischen dem relativen Risiko und dem absoluten Risiko?

12

Neulich habe ich mich mit einem Epidemiologen beraten lassen. Sie ist Ärztin mit einem Abschluss in Epidemiologie im Gesundheitswesen und verfügt über umfangreiche statistische Kenntnisse. Sie betreut ihre Forschungsstipendiaten und Bewohner und hilft ihnen bei statistischen Fragen. Sie versteht Hypothesentests ziemlich gut. Sie hatte das typische Problem, zwei Gruppen zu vergleichen, um festzustellen, ob ein Unterschied im Risiko besteht, an einer Herzinsuffizienz (CHF) zu erkranken. Sie testete den mittleren Unterschied im Anteil der Probanden, die CHF erhielten. Der p-Wert betrug 0,08. Dann entschied sie sich auch für das relative Risiko und erhielt einen p-Wert von 0,027. Also fragte sie, warum der eine bedeutsam ist und der andere nicht. Bei Betrachtung von 95% zweiseitigen Konfidenzintervallen für die Differenz und für das Verhältnis stellte sie fest, dass das mittlere Differenzintervall 0 enthielt, die obere Konfidenzgrenze für das Verhältnis jedoch unter 1 lag. Warum erhalten wir also inkonsistente Ergebnisse? Meine technisch korrekte Antwort war nicht sehr zufriedenstellend. Ich sagte: "Dies sind unterschiedliche Statistiken und können unterschiedliche Ergebnisse liefern. Die p-Werte liegen beide im Bereich von geringfügiger Bedeutung. Dies kann leicht passieren." Ich denke, es muss bessere Möglichkeiten geben, dies den Ärzten gegenüber als Laien zu beantworten, damit sie den Unterschied zwischen dem Testen des relativen Risikos und dem absoluten Risiko verstehen. In epi-Studien tritt dieses Problem häufig auf, weil sie seltene Ereignisse untersuchen, bei denen die Inzidenzraten für beide Gruppen sehr gering und die Stichprobengröße nicht sehr groß sind. Ich habe ein wenig darüber nachgedacht und habe einige Ideen, die ich teilen werde. Aber zuerst würde ich gerne hören, wie einige von Ihnen damit umgehen würden. Ich weiß, dass viele von Ihnen im medizinischen Bereich arbeiten oder sich beraten lassen und sich wahrscheinlich mit diesem Problem befasst haben. Was würden Sie tun?

Michael R. Chernick
quelle
Enthalten die Modelle neben dem Gruppeneffekt noch andere Kovariaten?
1.
@onestop Es gibt Kovariaten, an deren Betrachtung sie interessiert sind, aber der eigentliche Test hat nur den Haupteffekt verglichen. Wenn Sie einen Kommentar abgeben möchten, nehmen Sie an, dass der Test auf einem Regressionsmodell oder einem Ereignis basiert, und wir Zeit hatten, Ereignisdaten für ein Cox-Regressionsmodell zu erfassen, können Sie ihn gerne kommentieren. Ich würde gerne Ihre Einsichten hören. Meine Frage richtet sich an das allgemeine Problem und nicht nur an das konkrete Beispiel.
Michael R. Chernick
Habe ich gemeint, wurde der Test zum Vergleich des Haupt- (Gruppen-) Effekts für Kovariaten angepasst oder nicht angepasst? Ist dies nicht der Fall, kann es hilfreich sein, uns die 2 × 2-Tabelle oder eine ähnliche Tabelle zu geben, um die Ideen zu fokussieren.
1.
Unangepasst für diese speziellen Tests.
Michael R. Chernick

Antworten:

7

Nun, von dem, was Sie bereits gesagt haben, denke ich, Sie haben das meiste abgedeckt, müssen es aber nur in ihrer Sprache ausdrücken: Einer ist ein Unterschied von Risiken, einer ist ein Verhältnis. Ein Hypothesentest fragt also, ob während der andere fragt, ob p 2 istp2p1=0. Manchmal sind diese "nah" manchmal nicht. (Schließen Sie in Anführungszeichen, da sie offensichtlich nicht im üblichen arithmetischen Sinne schließen). Wenn das Risiko selten ist, sind diese typischerweise "weit voneinander entfernt". zB.002/.001=2(weit entfernt von 1), während.002-.001=.001(nahe bei 0); Wenn das Risiko jedoch hoch ist, handelt es sich um "nahe":.2/.1=2(bei weitem nicht 0) undp2p1=1.002/.001=2.002.001=.001.2/.1=2 (auch weit von 0 entfernt, zumindest verglichen mit dem seltenen Fall)..2.1=.1

Peter Flom - Wiedereinsetzung von Monica
quelle
2
Sie haben eine meiner Ideen darin, wenn die Anzahl klein ist, was bei der Untersuchung von Unterschieden bei niedrigen Inzidenzraten üblich ist, die klein aussehen, aber die Verhältnisse immer noch groß aussehen. Ihr Zahlenbeispiel ist sehr überzeugend. Ich bin versucht, etwas über die Stabilität der Schätzungen unter der Nullhypothese hinzuzufügen. Für manche mag dies zu technisch sein, für sie jedoch vielleicht nicht. Angenommen, die beiden Populationen haben eine Nominalverteilung von Null und eine bekannte gemeinsame Varianz. Dann ist die normalisierte Differenz N (0,1) unter der Nullhyothese, was eine sehr stabile Teststatistik ergibt.
Michael R. Chernick
1
Unter diesen Annahmen hat das Verhältnis eine Cauchy-Verteilung und kann sehr groß sein. Möglicherweise muss dieses Argument geändert werden, da die Inzidenzraten positiv sein müssen und möglicherweise die Verteilung sehr verzerrt ist. Ich schätze, ich möchte ein Beispiel, das zeigt, dass der Unterschied eine sehr stabile Verteilung hat und das Verhältnis nicht besonders, weil die Stichprobengröße klein ist und der Nenner sehr nahe an 0 heranreicht. Hat jemand ein gutes anschauliches Beispiel?
Michael R. Chernick
@ Peter Meinen Sie drei schreiben nicht zwei s? Wenn ja, können Sie Ihre Notation definieren? pi
1.
Ich denke, er meinte p1, als er p0 schrieb. Nur ein Grundfehler. In diesem Zusammenhang macht es keinen Sinn, drei ps zu haben.
Michael R. Chernick
1
Ich habe das Wechselgeld für Peter gemacht. Schrei mich an, wenn ich etwas falsch gemacht habe!
Michael R. Chernick
6

Beachten Sie, dass Sie in beiden Tests eine völlig andere Hypothese mit unterschiedlichen Annahmen testen. Die Ergebnisse sind nicht vergleichbar, und das ist ein viel zu häufiger Fehler.

Im absoluten Risiko testen Sie, ob die (durchschnittliche) Proportionsdifferenz signifikant von Null abweicht. Die zugrunde liegende Hypothese im Standardtest geht davon aus, dass die Proportionsunterschiede normalverteilt sind. Dies kann für kleine Proportionen gelten, aber nicht für große. Technisch berechnen Sie die folgende bedingte Wahrscheinlichkeit:

P(p1p2=0|X)

mit und p 2 die beiden Proportionen und X Ihre erklärende Variable. Dies entspricht dem Testen der Steigung b des folgenden Modells:p1p2Xb

p=a+bX+ϵ

wo Sie annehmen, dass ϵN(0,σ) .

Beim relativen Risiko machen Sie etwas ganz anderes. Sie testen , um die Chancen für ein positives Ergebnis auf die erklärende Variable Basis mit . Sie rechnen alsoX

P(log(p1p2)=0|X)

Dies entspricht dem Testen des Gefälles im folgenden logistischen Modell:

log(p1p)=a+bX+ϵ

mit log(p1p) ist das Protokoll der Gewinnchancen. Beachten Sie, dass diese Hypothese in Bezug auf die Gewinnchancen und nicht auf die Proportionen formuliert ist! Die Annahmen des Modells werden also auch in Bezug auf die Gewinnchancen (oder genauer das Protokoll der Gewinnchancen) formuliert. Sie testen eine andere Hypothese.

Der Grund, warum dies einen Unterschied macht, ist in der Antwort von Peter Flom angegeben: Ein kleiner Unterschied bei den absoluten Risiken kann zu einem großen Wert für die Gewinnchancen führen. In Ihrem Fall bedeutet dies, dass sich der Anteil der Menschen, die an der Krankheit leiden, nicht wesentlich unterscheidet. Die Wahrscheinlichkeit, in einer Gruppe zu sein, ist jedoch erheblich höher als die Wahrscheinlichkeit, in der anderen Gruppe zu sein. Das ist durchaus sinnvoll.

Joris Meys
quelle
1
Ich denke, wir sind uns alle einig, dass der Hauptgrund für das Problem darin besteht, dass kleine Unterschiede im absoluten Risiko zu großen Unterschieden im relativen Risiko führen können. Immerhin haben .2 bis .1 das gleiche relative Risiko wie 0,0002 bis 0,0001. Ich denke, das ist die Botschaft, die wir dem Laien nach Hause bringen können. Ihre Erklärung ist gut für Statistiker, aber ich bin mir nicht sicher, ob es für einen Laien leicht zu verstehen ist und man könnte sagen: "Was ist, wenn Sie eine andere Hypothese testen.
Michael R. Chernick
Sie versuchen immer noch festzustellen, wo die Preise unterschiedlich sind oder nicht. Auch wenn die Hypothesen unterschiedlich sind, sollten die Ergebnisse konsistent sein. Immerhin ist p1-p2 = 0 dasselbe wie p1 / p2 = 1. "Ich denke, die Tatsache, dass die Hypothesen unterschiedlich sind, geht am Rande der Sache vorbei und ist keine zufriedenstellende Erklärung.
Michael R. Chernick
@MichaelChernick Ich wollte gerade sagen, dass die Proportionsunterschiede bedingt sind und die Odds Ratio nicht. Dies ist jedoch nicht der Fall, da beide nach dem Vertauschen der Tabelle genau das gleiche Ergebnis liefern (im Fall einer 2X2-Tabelle). Ich habe einige Simulationen ausgeführt, aber ich kann nicht erzwingen, dass die p-Werte von prop.test(oder chisq.testwie es im 2x2-Fall äquivalent ist) und fisher.testmehr als 0,005 voneinander entfernt sind. Also frage ich mich, welche Tests sie verwendet hat ...
Joris Meys
It would either be chi square or Fisher's test. Most likely Fisher's test because she knows in small samples that the chi square approximatation is not good. When I do statistics for them I use SAS. She did her work using STATA. I can probably dig up the actual table.
Michael R. Chernick
2
One additional consideration, since we're getting into this: log(p1p0)=log(p1)log(p0) das ist deutlich anders als p1-p0und es ist genauer anders, wenn die p klein sind - das heißt, das Risiko ist gering. Aber ich habe versucht, meine erste Antwort so schnell wie möglich zu behalten (das ist so einfach wie möglich!)
Peter Flom - Wiedereinsetzung von Monica