Neulich habe ich mich mit einem Epidemiologen beraten lassen. Sie ist Ärztin mit einem Abschluss in Epidemiologie im Gesundheitswesen und verfügt über umfangreiche statistische Kenntnisse. Sie betreut ihre Forschungsstipendiaten und Bewohner und hilft ihnen bei statistischen Fragen. Sie versteht Hypothesentests ziemlich gut. Sie hatte das typische Problem, zwei Gruppen zu vergleichen, um festzustellen, ob ein Unterschied im Risiko besteht, an einer Herzinsuffizienz (CHF) zu erkranken. Sie testete den mittleren Unterschied im Anteil der Probanden, die CHF erhielten. Der p-Wert betrug 0,08. Dann entschied sie sich auch für das relative Risiko und erhielt einen p-Wert von 0,027. Also fragte sie, warum der eine bedeutsam ist und der andere nicht. Bei Betrachtung von 95% zweiseitigen Konfidenzintervallen für die Differenz und für das Verhältnis stellte sie fest, dass das mittlere Differenzintervall 0 enthielt, die obere Konfidenzgrenze für das Verhältnis jedoch unter 1 lag. Warum erhalten wir also inkonsistente Ergebnisse? Meine technisch korrekte Antwort war nicht sehr zufriedenstellend. Ich sagte: "Dies sind unterschiedliche Statistiken und können unterschiedliche Ergebnisse liefern. Die p-Werte liegen beide im Bereich von geringfügiger Bedeutung. Dies kann leicht passieren." Ich denke, es muss bessere Möglichkeiten geben, dies den Ärzten gegenüber als Laien zu beantworten, damit sie den Unterschied zwischen dem Testen des relativen Risikos und dem absoluten Risiko verstehen. In epi-Studien tritt dieses Problem häufig auf, weil sie seltene Ereignisse untersuchen, bei denen die Inzidenzraten für beide Gruppen sehr gering und die Stichprobengröße nicht sehr groß sind. Ich habe ein wenig darüber nachgedacht und habe einige Ideen, die ich teilen werde. Aber zuerst würde ich gerne hören, wie einige von Ihnen damit umgehen würden. Ich weiß, dass viele von Ihnen im medizinischen Bereich arbeiten oder sich beraten lassen und sich wahrscheinlich mit diesem Problem befasst haben. Was würden Sie tun?
quelle
Antworten:
Nun, von dem, was Sie bereits gesagt haben, denke ich, Sie haben das meiste abgedeckt, müssen es aber nur in ihrer Sprache ausdrücken: Einer ist ein Unterschied von Risiken, einer ist ein Verhältnis. Ein Hypothesentest fragt also, ob während der andere fragt, ob p 2 istp2−p1=0 . Manchmal sind diese "nah" manchmal nicht. (Schließen Sie in Anführungszeichen, da sie offensichtlich nicht im üblichen arithmetischen Sinne schließen). Wenn das Risiko selten ist, sind diese typischerweise "weit voneinander entfernt". zB.002/.001=2(weit entfernt von 1), während.002-.001=.001(nahe bei 0); Wenn das Risiko jedoch hoch ist, handelt es sich um "nahe":.2/.1=2(bei weitem nicht 0) undp2p1=1 .002/.001=2 .002−.001=.001 .2/.1=2 (auch weit von 0 entfernt, zumindest verglichen mit dem seltenen Fall)..2−.1=.1
quelle
Beachten Sie, dass Sie in beiden Tests eine völlig andere Hypothese mit unterschiedlichen Annahmen testen. Die Ergebnisse sind nicht vergleichbar, und das ist ein viel zu häufiger Fehler.
Im absoluten Risiko testen Sie, ob die (durchschnittliche) Proportionsdifferenz signifikant von Null abweicht. Die zugrunde liegende Hypothese im Standardtest geht davon aus, dass die Proportionsunterschiede normalverteilt sind. Dies kann für kleine Proportionen gelten, aber nicht für große. Technisch berechnen Sie die folgende bedingte Wahrscheinlichkeit:
mit und p 2 die beiden Proportionen und X Ihre erklärende Variable. Dies entspricht dem Testen der Steigung b des folgenden Modells:p1 p2 X b
wo Sie annehmen, dassϵ∼N(0,σ) .
Beim relativen Risiko machen Sie etwas ganz anderes. Sie testen , um die Chancen für ein positives Ergebnis auf die erklärende Variable Basis mit . Sie rechnen alsoX
Dies entspricht dem Testen des Gefälles im folgenden logistischen Modell:
mitlog(p1−p) ist das Protokoll der Gewinnchancen. Beachten Sie, dass diese Hypothese in Bezug auf die Gewinnchancen und nicht auf die Proportionen formuliert ist! Die Annahmen des Modells werden also auch in Bezug auf die Gewinnchancen (oder genauer das Protokoll der Gewinnchancen) formuliert. Sie testen eine andere Hypothese.
Der Grund, warum dies einen Unterschied macht, ist in der Antwort von Peter Flom angegeben: Ein kleiner Unterschied bei den absoluten Risiken kann zu einem großen Wert für die Gewinnchancen führen. In Ihrem Fall bedeutet dies, dass sich der Anteil der Menschen, die an der Krankheit leiden, nicht wesentlich unterscheidet. Die Wahrscheinlichkeit, in einer Gruppe zu sein, ist jedoch erheblich höher als die Wahrscheinlichkeit, in der anderen Gruppe zu sein. Das ist durchaus sinnvoll.
quelle
prop.test
(oderchisq.test
wie es im 2x2-Fall äquivalent ist) undfisher.test
mehr als 0,005 voneinander entfernt sind. Also frage ich mich, welche Tests sie verwendet hat ...