10

Standardunterricht besagt, dass Sensitivität und Spezifität Eigenschaften des Tests sind und unabhängig von der Prävalenz. Aber ist das nicht nur eine Annahme?

Harrisons Prinzipien der Inneren Medizin 19. Ausgabe sagt

Es ist seit langem behauptet worden, dass Sensitivität und Spezifität prävalenzunabhängige Parameter der Testgenauigkeit sind, und viele Texte geben diese Aussage immer noch ab. Diese statistisch nützliche Annahme ist jedoch klinisch vereinfacht. ... wird die Testempfindlichkeit bei Krankenhauspatienten wahrscheinlich höher und die Testspezifität bei ambulanten Patienten höher sein.

(Die Prävalenz ist bei stationären Patienten typischerweise höher als bei ambulanten Patienten)

Gibt es eine mathematische oder eine ungefähre grafische Beziehung zwischen diesen Parametern?

Auch dieser Link nennt es eine "Vereinfachung". Warum?

Bearbeiten: Ich weiß, wie Empfindlichkeit definiert ist. Es gibt keinen Begriff der Prävalenz, wie in den Antworten erwähnt. Ich selbst habe behauptet, dass dies Eigenschaften des Tests sind, die von der verwendeten Population nicht beeinflusst werden, bis ich auf diese Aussage stieß, daher die Frage. Ich gehe jedoch davon aus, dass diese Verwirrung nicht auf die Definition, sondern auf die praktische Berechnung dieser Werte zurückzuführen ist. Spezifität und Sensitivität werden anhand von 2x2-Tabellen berechnet. Ist die Prävalenz der Referenzpopulation hier von Bedeutung? Beziehen sie sich darauf? Wenn ja, welche Funktion hat das?

bayesian epidemiology diagnostic sensitivity-specificity Polisetty
quelle

4

Obwohl die Antworten von @ Tim ♦ und @ gung ♦ so ziemlich alles abdecken, werde ich versuchen, beide zu einer einzigen zusammenzufassen und weitere Erläuterungen zu geben.

Der Kontext der zitierten Zeilen kann sich meistens auf klinische Tests in Form eines bestimmten Schwellenwerts beziehen, wie dies am häufigsten der Fall ist. Stellen Sie sich eine Krankheit und alles außer einschließlich des als bezeichneten gesunden Zustands . Für unseren Test möchten wir eine Proxy- Messung finden, die es uns ermöglicht, eine gute Vorhersage für . (1) Der Grund, warum wir keine absolute Spezifität / Sensitivität erhalten, ist, dass die Werte unserer Proxy-Menge nicht perfekt mit diesen korrelieren Der Krankheitszustand ist jedoch nur allgemein damit verbunden, und daher besteht bei einzelnen Messungen möglicherweise die Möglichkeit, dass diese Menge unsere Schwelle für überschreitet $D$ $D$ $D^c$ $D$ $D^c$ Einzelpersonen und umgekehrt. Nehmen wir der Klarheit halber ein Gaußsches Modell für die Variabilität an.

Nehmen wir an, wir verwenden als Proxy-Größe. Wenn gewählt wurde, muss höher sein als ( ist der Operator für den erwarteten Wert). Das Problem tritt nun auf, wenn wir erkennen, dass eine zusammengesetzte Situation ist (ebenso wie ), die tatsächlich aus 3 Schweregraden , , , von denen jede einen progressiv ansteigenden erwarteten Wert für . Für eine einzelne Person, ausgewählt entweder aus der Kategorie oder aus der Kategorie $x$ $x$ $E[x_D]$ $E[x_{Dc}]$ $E$ $D$ $D^c$ $D_1$ $D_2$ $D_3$ $x$ $D$ $D^c$ Kategorie hängt die Wahrscheinlichkeit, ob der 'Test' positiv wird oder nicht, von dem von uns gewählten Schwellenwert ab. Nehmen wir an, wir wählen basierend auf der Untersuchung einer wirklich zufälligen Stichprobe mit und Individuen. Unser verursacht einige falsch positive und negative . Wenn wir eine Person zufällig auswählen , wird die Wahrscheinlichkeit, die ihren Wert bestimmt, durch das grüne Diagramm und die einer zufällig ausgewählten Person durch das rote Diagramm angegeben. $x_T$ $D$ $D^c$ $x_T$ $D$ $x$ $D_c$

Die tatsächlich erhaltenen Zahlen hängen von der tatsächlichen Anzahl von und Individuen ab, die resultierende Spezifität und Sensitivität jedoch nicht. Sei eine kumulative Wahrscheinlichkeitsfunktion. Für die Prävalenz von der Krankheit ist hier eine 2x2-Tabelle, wie es für den allgemeinen Fall zu erwarten wäre, wenn wir versuchen, tatsächlich zu sehen, wie unser Test in der kombinierten Population abläuft. $D$ $D^c$ $F()$ $p$ $D$

(D, +) = p (1 - F_{D} (x_{T}))

$(D,+) = p(1-F_D(x_T))$

(D c, -) = (1 - p) (1 - F_{D c} (x_{T}))

$(Dc,-) = (1-p)(1-F_{Dc}(x_T))$

(D, -) = p (F_{D} (x_{T}))

$(D,-) = p(F_D(x_T))$

(D c, +) = (1 - p) * F_{D c} (x_{T})

$(Dc,+) = (1-p)*F_{Dc}(x_T)$

Die tatsächlichen Zahlen sind abhängig, aber Sensitivität und Spezifität sind unabhängig. Beide sind jedoch abhängig von und . Daher werden alle Faktoren, die diese beeinflussen, diese Metriken definitiv ändern. Wenn wir zum Beispiel auf der Intensivstation würden, würde unsere stattdessen durch , und wenn wir über ambulante Patienten sprechen würden, würde sie durch . Es ist eine separate Sache, dass im Krankenhaus die Prävalenz auch unterschiedlich ist, $p$ $p$ $F_D$ $F_{Dc}$ $F_D$ $F_{D3}$ $F_{D1}$ Es ist jedoch nicht die unterschiedliche Prävalenz, die dazu führt, dass sich die Sensitivitäten und Spezifitäten unterscheiden, sondern die unterschiedliche Verteilung, da das Modell, nach dem der Schwellenwert definiert wurde, nicht auf die ambulant oder stationär erscheinende Bevölkerung anwendbar war . Sie können gehen Sie vor und brechen in mehrere Subpopulationen, becasue stationären subpart von wird auch eine erhöhte haben aus anderen Gründen (da die meisten Proxies sind auch ‚erhöht‘ in anderen schweren Bedingungen). Die Aufteilung der Population in Subpopulation erklärt die Änderung der Sensitivität, während die der Population die Änderung der Spezifität erklärt (durch entsprechende Änderungen von und $D^c$ $D^c$ $x$ $D$ $D^c$ $F_D$ $F_{Dc}$ ). Daraus besteht der zusammengesetzte Graph tatsächlich. Jede der Farben hat tatsächlich ein eigenes , und solange sich dieses von dem für das die ursprüngliche Empfindlichkeit und Spezifität berechnet wurden, ändern sich diese Metriken. $D$ $F$ $F$

Beispiel

Nehmen Sie eine Bevölkerung von 11550 mit 10000 Dc, 500.750.300 D1, D2 bzw. D3 an. Der auskommentierte Teil ist der Code, der für die obigen Diagramme verwendet wird.

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

Wir können leicht die x-Mittelwerte für die verschiedenen Populationen berechnen, einschließlich Dc, D1, D2, D3 und das zusammengesetzte D.

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

Um eine 2x2-Tabelle für unseren ursprünglichen Testfall zu erhalten, legen wir zunächst einen Schwellenwert fest, der auf den Daten basiert (der in einem realen Fall nach dem Ausführen des Tests festgelegt wird, wie @gung zeigt). Unter der Annahme eines Schwellenwerts von 13,5 erhalten wir die folgende Sensitivität und Spezifität, wenn sie für die gesamte Population berechnet werden.

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

Nehmen wir an, wir arbeiten mit ambulanten Patienten und bekommen kranke Patienten nur ab dem D1-Anteil, oder wir arbeiten auf der Intensivstation, wo wir nur D3 bekommen. (Für einen allgemeineren Fall müssen wir auch die Gleichstromkomponente aufteilen.) Wie ändern sich unsere Sensitivität und Spezifität? Durch Ändern der Prävalenz (dh durch Ändern des relativen Anteils der Patienten, die zu beiden Fällen gehören, ändern wir die Spezifität und Sensitivität überhaupt nicht. Es kommt nur so vor, dass sich diese Prävalenz auch mit der Änderung der Verteilung ändert).

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

Zusammenfassend lässt sich sagen, dass ein Diagramm zur Darstellung der Änderung der Sensitivität (die Spezifität würde einem ähnlichen Trend folgen, wenn wir auch die DC-Population aus Subpopulationen zusammengesetzt hätten) mit variierendem Mittelwert x für die Population ein Diagramm darstellt

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

Wenn es kein Proxy ist, hätten wir technisch eine 100% ige Spezifität und Sensitivität. Nehmen wir zum Beispiel an, wir definieren als ein bestimmtes objektiv definiertes pathologisches Bild bei der Leberbiopsie, dann wird der Leberbiopsietest zum Goldstandard und unsere Empfindlichkeit würde an sich selbst gemessen und ergibt somit 100% $D$

Satwik Pasani
quelle

9

Zunächst ist zu beachten, dass Sie die Empfindlichkeit normalerweise nicht unabhängig von der Spezifität ändern können und umgekehrt. Dies ist der Punkt einer ROC-Kurve. Angesichts der Art des Datengenerierungsprozesses und Ihrer spezifischen Daten und Modelle werden Sie immer einen Kompromiss zwischen Sensitivität und Spezifität finden. Sie würden natürlich lieber 100% Sensitivität und 100% Spezifität gleichzeitig haben, aber normalerweise können Sie das nicht. Sie können eine bessere Empfindlichkeit erzielen, jedoch auf Kosten einer schlechteren Spezifität oder einer besseren Spezifität, jedoch auf Kosten einer schlechtesten Empfindlichkeit. Die ROC-Kurve zeigt Ihnen die Kompromisse, zwischen denen Sie wählen müssen. (Ein paar Anmerkungen: 1. Manchmal scheinen Sie in einer Dimension zu gewinnen, ohne in der anderen etwas zu verlieren, da Ihr Datensatz eine Lücke aufweist, dies ist jedoch meistens illusorisch. 2.Die ROC- Kurve ist die Empfindlichkeit als Funktion der 1-Spezifität. Das Auftragen der Empfindlichkeit gegen die Spezifität selbst wäre eine reflektierte ROC-Kurve.)

Wie könnte sich die scheinbare Sensitivität und Spezifität jedenfalls mit der Prävalenz ändern? Dies ist ein Problem, bei dem es hilfreich ist, einige Daten zu simulieren und damit zu spielen, um zu sehen, wie dies in der Praxis funktionieren kann. Stellen wir uns vor, ein Modell passt zu einem ziemlich großen Datensatz mit einer bestimmten Prävalenz, und auf der x-Achse ^{1 wird} ein Schwellenwert festgelegt . Später wird die Leistung dieses Tests mit Proben berechnet, die wesentlich unterschiedliche Prävalenzen (und damit unterschiedliche x-Werte) aufweisen. Das Ergebnis ist, dass dasselbe Modell mit demselben Schwellenwert eine unterschiedliche Leistung erzielt, wenn es auf Datensätze mit unterschiedlichen Prävalenzen angewendet wird.

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

Hier sind die Sensitivitäten und Spezifitäten als Funktion der Prävalenzen mit genauen 95% -Konfidenzintervallen:

Also, was ist hier los? Bedenken Sie, dass eine prototypische logistische Regression ungefähr so aussehen könnte wie in der folgenden Abbildung. Beachten Sie, dass die gesamte Aktion im Intervall [4, 6] auf der x-Achse stattfindet. Daten darunter haben eine sehr geringe Prävalenz, und das Modell zeigt eine geringe Diskriminierung und Sensitivität. Daten über diesem Intervall haben eine sehr hohe Prävalenz, aber das Modell wird wiederum nicht gut diskriminieren und eine schlechte Spezifität aufweisen.

Um zu verstehen, wie dies geschehen kann, sollten Sie die Alanin-Transaminase testen, um festzustellen, ob die Leber des Patienten versagt ². Die Idee ist, dass die Leber normalerweise ALT verwendet, aber wenn die Leber nicht mehr funktioniert, wird ALT in den Blutkreislauf abgelassen. Wenn also der ALT-Spiegel im Blutkreislauf eines Patienten über einem bestimmten Schwellenwert liegt, bedeutet dies, dass die Leber versagt. Wenn Sie eine Probe mit einer hohen Prävalenz von Leberversagen entnehmen, ziehen Sie eine Probe mit einem hohen ALT-Spiegel im Blut. Somit haben Sie mehr Patienten über der Schwelle. Nicht jeder mit einem hohen ALT-Blutspiegel hat ein Leberversagen - bei einigen Patienten gibt es eine andere Ursache. Aber diejenigen mit Leberversagen sollten gefangen werden. Dies führt zu einer höheren Empfindlichkeit. Ebenso haben nicht alle Patienten mit normalen ALT-Spiegeln gesunde Lebern, aber eine Probe mit niedriger Prävalenz weist niedrigere ALT-Spiegel auf und mehr Patienten bestehen den Test. Diejenigen, deren Lebern nicht sind t scheitert, aber wer normale ALT-Werte hat, wird vermisst. Dies führt zu einer geringeren Empfindlichkeit, aber einer höheren Spezifität.

Im Allgemeinen ist die ganze Idee eines medizinischen Tests, dass irgendetwas das Korrelat eines Krankheitszustands ist, dessen direkte Messung Sie vielleicht möchten, aber nicht können. Wenn Sie ein Maß für das Korrelat erhalten, erhalten Sie einen Einblick in den Krankheitszustand. Ein (potenzieller) Test, bei dem dies nicht der Fall ist, hat keinen Wert und wird nicht verwendet. Daher sollten Proben mit höherer Prävalenz in der Praxis eine Verteilung des Korrelats mit abnormaleren Werten aufweisen, was zu einer höheren Empfindlichkeit führt, und umgekehrt. (Beachten Sie, dass das Korrelat keine Ursache der Krankheit sein muss; im ALT-Beispiel ist es eine Auswirkung, in anderen Beispielen können sowohl die Krankheit als auch das Korrelat Auswirkungen einer gemeinsamen Ursache usw. sein.)

_{1. Dies ist in der Medizin eigentlich recht häufig. Bedenken Sie, dass Cholesterin <200, der systolische Blutdruck <140 usw. sein sollte. Das sind an sich keine wirklichen „Tests“, aber es gibt viele Tests, die einfach so funktionieren. Bei einigen (möglicherweise entfernt) verwandten Diskussionen zu Schwellenwerten kann es hilfreich sein, meine Antworten auf Lesen Sie, ob 0-1-Schwellenwerte immer den Schwellenwerten der x-Achse entsprechen? , und Warum ist die Anzahl der falsch positiven Ergebnisse unabhängig von der Stichprobengröße, wenn wir p-Werte verwenden, um zwei unabhängige Datensätze zu vergleichen?

2. Bitte beachten Sie, dass ich kein Arzt bin und dieses Beispiel möglicherweise stark verpfuscht ist. Fragen Sie einen Arzt, ob Sie genaue Informationen über die Leberfunktion, deren Tests und verwandte Themen wünschen.}

gung - Monica wieder einsetzen
quelle

Vielen Dank! Um zu zeigen, dass es sich tatsächlich ändert. Aber wie sieht es mit der Antwort von @Tim aus? Ist es nicht widersprüchlich?

Polisetty

1

@Polisetty, Tim, erklärt, dass "stationäre und ambulante Patienten sich in vielen Aspekten unterscheiden können, nicht nur in der Prävalenz allein, so dass einige andere Faktoren die Empfindlichkeit beeinflussen können". Wenn der Test eine Funktion einer Eigenschaft von Patienten ist (z. B. Cholesterin) und die Krankheit auch mit dieser Eigenschaft stark korreliert ist (was im Allgemeinen der springende Punkt ist), müssen sich die "anderen Faktoren" in Verbindung mit bewegen die Prävalenz. Wenn sich also die Prävalenz ändert, ändern sich die anderen Korrelate, und der Test hat mehr oder weniger Empfindlichkeit für diese bestimmte Gruppe.

Gung - Reinstate Monica

7

Wie bereits von anderen gesagt, hängen Sensitivität und Spezifität nicht von der Prävalenz ab. Die Sensitivität ist der Anteil der echten Positiven an allen Positiven und die Spezifität ist der Anteil der echten Negative an allen Negativen. Wenn also die Empfindlichkeit 90% beträgt, ist der Test in 90% der positiven Fälle korrekt. Offensichtlich sind 90% von etwas Kleinerem und 90% von etwas Größerem immer noch 90% ...

Angesichts der von Ihnen erwähnten tabellarischen Daten

\begin{array}{cc} \begin{matrix} positive \\ condition \end{matrix} & \begin{matrix} negative \\ condition \end{matrix} \\ \begin{matrix} positive \\ test \end{matrix} & a & c \\ \begin{matrix} negative \\ test \end{matrix} & b & d \end{array}

$\begin{array}{cc} & \substack{\text{positive} \\ \text{condition}} & \substack{\text{negative} \\ \text{condition}}\\ \substack{\text{positive} \\ \text{test}} & a & c \\ \substack{\text{negative} \\ \text{test}} & b & d \\ \end{array}$

Die Empfindlichkeit ist (von Die Definition der bedingten Wahrscheinlichkeit ) und der Spezifität ist . Für jede der Metriken wird jeweils nur eine der Spalten angezeigt, sodass die Prävalenz (relative Größe der Spalten) für diese Metriken keine Rolle spielt. Die Prävalenz kommt nicht in die Gleichungen. Es wäre auch ziemlich seltsam, wenn die "praktische" Empfindlichkeit anders als theoretisch definiert würde und zu unterschiedlichen Schlussfolgerungen führen würde. $\tfrac{a}{a+b+c+d} \,/\, \tfrac{a+b}{a+b+c+d} = \tfrac{a}{a+b}$ $p(Y \mid X) = \tfrac{p(Y \cap X)}{p(X)}$ $\tfrac{d}{a+b+c+d} \,/\, \tfrac{c+d}{a+b+c+d} = \tfrac{d}{c+d}$

Das Zitat scheint aber auch etwas anderes zu sagen

Die Testempfindlichkeit ist bei Krankenhauspatienten wahrscheinlich höher und die Testspezifität bei ambulanten Patienten höher

Die Autoren sagen, dass die Empfindlichkeit in verschiedenen Gruppen unterschiedlich ist. Ich vermute, dass sich stationäre und ambulante Patienten in vielen Aspekten unterscheiden können, nicht nur in der Prävalenz allein, so dass einige andere Faktoren die Empfindlichkeit beeinflussen können. Also Ich bin damit einverstanden , dass sie können zwischen verschiedenen Datensatz ändern, die in der Prävalenz unterscheiden, aber die Änderung (wie gezeigt nicht eine Funktion der Prävalenz selbst sein @gung in seiner Antwort).

Andererseits, wenn ich raten müsste, verwechseln die Autoren vielleicht die Sensibilität mit der posterioren Wahrscheinlichkeit . Die Empfindlichkeit ist , während die hintere Wahrscheinlichkeit ist $p(\text{positive test}\mid\text{condition})$

p (condition ∣ positive test) \propto p (positive test ∣ condition) \times p (condition)

$p(\text{condition}\mid\text{positive test}) \propto p(\text{positive test}\mid\text{condition})\times p(\text{condition})$

und in vielen Fällen ist dies die Wahrscheinlichkeit, an der die Menschen interessiert sind ("Wie wahrscheinlich ist es, dass ein Patient mit einem positiven Testergebnis tatsächlich an der Krankheit leidet?"), und sie hängt von der Prävalenz ab. Beachten Sie, dass in Ihrem Link auch die Auswirkungen der Prävalenz auf den positiven Vorhersagewert, dh die hintere Wahrscheinlichkeit, und nicht auf die Empfindlichkeit erläutert werden.

Tim
quelle

Wie ich in einer der vorherigen Antworten erwähnt habe, bin ich mir ziemlich sicher, dass die Autoren es nicht mit der hinteren Wahrscheinlichkeit verwechselt haben, da sie ausdrücklich erwähnen, dass "viele Texte diese Aussage noch machen". Und ich zitiere auch eine andere Quelle, obwohl sie nicht so zuverlässig ist wie die von Harrison, die besagt, dass es sich um eine sichere "Annahme" handelt. Ich möchte nur fragen, was ist die "Annahme"?

Polisetty

2

@Polisetty Ich kann nicht für die Autoren sagen, aber aus dem Zitat scheinen sie die Unabhängigkeit von der Prävalenz die "Annahme" zu nennen, aber dies ist eher eine mathematische Tatsache als eine Annahme. Wenn dies nicht der Fall wäre, würde dies bedeuten, dass die Wahrscheinlichkeitstheorie gebrochen ist und nicht.

Tim

Sensitivität und Spezifität können als feste Eigenschaften eines diagnostischen Tests angesehen werden. [Dies ist eine leichte Vereinfachung, aber für unsere Zwecke gut genug]. - das ist, was es sagt

Polisetty

3

Siehe meine Antwort hier zu wahren / falschen positiven / negativen Raten.

Die Empfindlichkeit ist nur ein anderer Name für die wahre positive Rate, und die Spezifität entspricht der tatsächlichen negativen Rate. Sowohl Sensitivität als auch Spezifität sind bedingte Wahrscheinlichkeiten; Sie hängen vom Krankheitsstatus des Patienten ab. Daher ist die Prävalenz der Krankheit (dh die a priori Wahrscheinlichkeit, dass ein Patient an der Krankheit leidet) irrelevant, da Sie von einem bestimmten Krankheitszustand ausgehen.

Ich kann nicht kommentieren, warum der Lehrbuchautor behauptet, dass Sensitivität und Spezifität vom klinischen Kontext abhängen. Sind das empirische Beobachtungen?

tddevlin
quelle

Genau. Daher die Frage. Die Empfindlichkeit eines Tests hängt von der verwendeten Population ab. Die Annahme, dass es unabhängig ist, ist nicht immer wahr. Ich frage wie und warum. Das Buch zitiert später auch Werte

Polisetty

Es könnte bevölkerungsspezifische Faktoren geben, die die Sensitivität und Spezifität beeinflussen. Aus den mathematischen Definitionen von Sensitivität und Spezifität folgt jedoch, dass die Prävalenz nicht einer dieser Faktoren sein kann, zumindest nicht direkt. (Übrigens,

zögern

Entschuldigung, ich denke es war nicht klar. Ich wollte den Zusammenhang zwischen Sensitivität und Prävalenz mathematisch kennen. Ich weiß, wie sie definiert sind. Ich denke, die Beziehung kommt aufgrund der Art und Weise, wie sie berechnet werden. Die Empfindlichkeit ist tp / (tp + fn), während die Prävalenz tp + fn / (tp + fn + fp + tn) ist

Polisetty

Wie ich in meiner Antwort erwähne, gibt es keinen Zusammenhang zwischen Sensitivität und Prävalenz. Die Prävalenz ist während die Empfindlichkeit . Sie können nichts über den Wert des einen basierend auf dem Wert des anderen sagen.

P (Disease)

$P(\text{Disease})$

P (+ | disease)

$P(+|\text{disease})$

tddevlin

Harrison würde es nicht falsch verstehen. Auch dieser Link nennt es eine Vereinfachung. med.uottawa.ca/sim/data/Sensitivity_and_Prevalence_e.htm

Polisetty

1

Ich kann natürlich nicht mit den Absichten des Autors sprechen, aber hier wäre meine Begründung für diese Aussage:

Betrachten Sie den klinischen Kontext als diagnostischen Test. Eine mit sehr geringer Sensitivität und Spezifität, aber dennoch einem Test. Wenn Sie im Krankenhaus sind, sind Sie wahrscheinlich krank. Wenn Sie nicht im Krankenhaus sind, sind Sie wahrscheinlich nicht krank.

Aus dieser Perspektive ist der eigentliche Diagnosetest, den Sie durchführen, der zweite Teil von zwei seriellen Tests.

Fomite
quelle

In Ihrer Erklärung ändert sich das Priori, was zu einer größeren posterioren Wahrscheinlichkeit führt. Das ist wahr. Aber wie verändert sich die Sensibilität selbst, ist die Frage.

Polisetty

@Polisetty Was ist, wenn Sie einen High Posterior als positiven Test bezeichnen? "Der klinische Kontext ist selbst ein Test." Ich denke, jeder willkürlich festgelegte Test kann auf diese Weise von der Prävalenz abhängen, daher muss der "Test" genauer definiert werden. Ich denke, die Aussage gilt für die übliche Vielzahl von Tests, die auf einem Schwellenwert für eine Proxy-Messung basieren.

Satwik Pasani

1

Das muss ein Fehler sein. Ich denke, der Autor versucht vielleicht vorzuschlagen, dass der positive und negative Vorhersagewert (PPV und NPV) von der Prävalenz (sowie von Sensitivität und Spezifität) abhängt. Diese werden oft mit diagnostischen Tests besprochen und sind für einen Kliniker vielleicht wertvoller als eine rohe Interpretation von Sensitivität und Spezifität.

Diese Grafik zeigt die Beziehung zwischen PPV und NPV mit der Prävalenz für einen Test mit 95% Sensitivität und 85% Spezifität.

Von Mausner JS, Kramer S: Mausner- und Bahn-Epidemiologie: Ein Einführungstext. Philadelphia, WB Saunders, 1985, p. 221.

prince_of_pears
quelle

1

@Satwik, @gung und @Tim haben bereits viele Details geliefert, aber ich werde versuchen, ein kleines Beispiel hinzuzufügen, wie der Fall der zugrunde liegenden Faktoren einen solchen Effekt verursachen kann.

Ein Schlüsselprinzip: Bias

Sensitivität / Spezifität und ALLE statistischen Tests haben dieselbe Einschränkung: Sie gelten nur für die unvoreingenommene Wiederholung des gleichen Probenahmeverfahrens wie zuvor.

Krankenhäuser sind funktionierende Organisationen, die voreingenommene Stichproben durchführen und Zulassungsrichtlinien verwenden, um die allgemeine Bevölkerung in diejenigen zu filtern, die eine Aufnahme und Behandlung benötigen. Dies ist ein Gegensatz zum wissenschaftlichen Verfahren. Wenn Sie wissen möchten, wie ein Test in verschiedenen Populationen durchgeführt wird, muss er in verschiedenen Populationen getestet werden.

Der latente Effekt: Korrelation

Es ist selten (oder in der realen Welt unmöglich, wenn Sie streng sein möchten), dass eine Diagnose unabhängig / orthogonal zu allen anderen Risikofaktoren für eine Krankheit ist, sodass ein gewisser Grad an Korrelation besteht.

Wenn der Bildschirm für die Aufnahme in ein Krankenhaus positiv mit der Diagnose korreliert, werden Sie feststellen, dass Personen, die den Aufnahmetest bestehen, für positive Ergebnisse durch die Diagnose positiv prädisponiert sind, proportional zur Korrelation. Somit werden wahre Positive angereichert und falsche Negative um Beträge reduziert, die proportional zur Korrelation sind.

Dadurch erscheint die Empfindlichkeit größer.

Die Erklärung des Phänomens

Eine Beobachtung, dass die Empfindlichkeit in einem Krankenhauskontext höher sein kann, ist daher nicht unrealistisch. In der Tat, wenn die Zulassungsrichtlinie gut durchdacht und zweckmäßig ist, würde man erwarten, dass dies geschieht.

Es ist kein Hinweis auf eine Aufschlüsselung der Annahme, dass Sensitivität und Spezifität unabhängig von der Prävalenz sind, sondern ein Hinweis auf eine voreingenommene Stichprobe auf der Grundlage der Krankenhauszulassungsrichtlinie.

Was angesichts der Tatsache, dass ein Krankenhaus dazu dient, Menschen zu behandeln und keine wissenschaftlichen Experimente durchzuführen, definitiv eine gute Sache ist.

Aber es bereitet Wissenschaftlern Kopfschmerzen.

ReneBt
quelle

Ist Sensitivität oder Spezifität eine Funktion der Prävalenz?

Antworten:

Beispiel

Ein Schlüsselprinzip: Bias

Der latente Effekt: Korrelation

Die Erklärung des Phänomens