Obwohl die Antworten von @ Tim ♦ und @ gung ♦ so ziemlich alles abdecken, werde ich versuchen, beide zu einer einzigen zusammenzufassen und weitere Erläuterungen zu geben.
Der Kontext der zitierten Zeilen kann sich meistens auf klinische Tests in Form eines bestimmten Schwellenwerts beziehen, wie dies am häufigsten der Fall ist. Stellen Sie sich eine Krankheit und alles außer einschließlich des als bezeichneten gesunden Zustands . Für unseren Test möchten wir eine Proxy- Messung finden, die es uns ermöglicht, eine gute Vorhersage für . (1) Der Grund, warum wir keine absolute Spezifität / Sensitivität erhalten, ist, dass die Werte unserer Proxy-Menge nicht perfekt mit diesen korrelieren Der Krankheitszustand ist jedoch nur allgemein damit verbunden, und daher besteht bei einzelnen Messungen möglicherweise die Möglichkeit, dass diese Menge unsere Schwelle für überschreitetD D c D D cD.D.D.cD.D.cEinzelpersonen und umgekehrt. Nehmen wir der Klarheit halber ein Gaußsches Modell für die Variabilität an.
Nehmen wir an, wir verwenden als Proxy-Größe. Wenn gewählt wurde, muss höher sein als ( ist der Operator für den erwarteten Wert). Das Problem tritt nun auf, wenn wir erkennen, dass eine zusammengesetzte Situation ist (ebenso wie ), die tatsächlich aus 3 Schweregraden , , , von denen jede einen progressiv ansteigenden erwarteten Wert für . Für eine einzelne Person, ausgewählt entweder aus der Kategorie oder aus der Kategoriex E [ x D ] E [ x D c ] E D D c D 1 D 2 D 3 x D D c x T D D c x T D x D cxxE.[ xD.]]E.[ xD c]]E.D.DcD1D2D3xDDcKategorie hängt die Wahrscheinlichkeit, ob der 'Test' positiv wird oder nicht, von dem von uns gewählten Schwellenwert ab. Nehmen wir an, wir wählen basierend auf der Untersuchung einer wirklich zufälligen Stichprobe mit und Individuen. Unser verursacht einige falsch positive und negative . Wenn wir eine Person zufällig auswählen , wird die Wahrscheinlichkeit, die ihren Wert bestimmt, durch das grüne Diagramm und die einer zufällig ausgewählten Person durch das rote Diagramm angegeben.xTDDcxTDxDc
Die tatsächlich erhaltenen Zahlen hängen von der tatsächlichen Anzahl von und Individuen ab, die resultierende Spezifität und Sensitivität jedoch nicht. Sei eine kumulative Wahrscheinlichkeitsfunktion. Für die Prävalenz von der Krankheit ist hier eine 2x2-Tabelle, wie es für den allgemeinen Fall zu erwarten wäre, wenn wir versuchen, tatsächlich zu sehen, wie unser Test in der kombinierten Population abläuft.D c F ( ) p D.DDcF()pD
(D,+)=p(1−FD(xT))
(Dc,−)=(1−p)(1−FDc(xT))
(D,−)=p(FD(xT))
(Dc,+)=(1−p)∗FDc(xT)
Die tatsächlichen Zahlen sind abhängig, aber Sensitivität und Spezifität sind unabhängig. Beide sind jedoch abhängig von und . Daher werden alle Faktoren, die diese beeinflussen, diese Metriken definitiv ändern. Wenn wir zum Beispiel auf der Intensivstation würden, würde unsere stattdessen durch , und wenn wir über ambulante Patienten sprechen würden, würde sie durch . Es ist eine separate Sache, dass im Krankenhaus die Prävalenz auch unterschiedlich ist,p F D F D C F D F D 3 F D 1 D c D c x D D c F D F D C D F F.ppFDFDcFDFD3FD1Es ist jedoch nicht die unterschiedliche Prävalenz, die dazu führt, dass sich die Sensitivitäten und Spezifitäten unterscheiden, sondern die unterschiedliche Verteilung, da das Modell, nach dem der Schwellenwert definiert wurde, nicht auf die ambulant oder stationär erscheinende Bevölkerung anwendbar war . Sie können gehen Sie vor und brechen in mehrere Subpopulationen, becasue stationären subpart von wird auch eine erhöhte haben aus anderen Gründen (da die meisten Proxies sind auch ‚erhöht‘ in anderen schweren Bedingungen). Die Aufteilung der Population in Subpopulation erklärt die Änderung der Sensitivität, während die der Population die Änderung der Spezifität erklärt (durch entsprechende Änderungen von undDcDcxDDcFDFDc ). Daraus besteht der zusammengesetzte Graph tatsächlich. Jede der Farben hat tatsächlich ein eigenes , und solange sich dieses von dem für das die ursprüngliche Empfindlichkeit und Spezifität berechnet wurden, ändern sich diese Metriken.DFF
Beispiel
Nehmen Sie eine Bevölkerung von 11550 mit 10000 Dc, 500.750.300 D1, D2 bzw. D3 an. Der auskommentierte Teil ist der Code, der für die obigen Diagramme verwendet wird.
set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))
#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')
Wir können leicht die x-Mittelwerte für die verschiedenen Populationen berechnen, einschließlich Dc, D1, D2, D3 und das zusammengesetzte D.
mean(dc)
mean(d1)
mean(d2)
mean(d3)
mean(as.numeric(d[,1]))
> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382
Um eine 2x2-Tabelle für unseren ursprünglichen Testfall zu erhalten, legen wir zunächst einen Schwellenwert fest, der auf den Daten basiert (der in einem realen Fall nach dem Ausführen des Tests festgelegt wird, wie @gung zeigt). Unter der Annahme eines Schwellenwerts von 13,5 erhalten wir die folgende Sensitivität und Spezifität, wenn sie für die gesamte Population berechnet werden.
sdc<-sample(dc,0.1*length(dc))
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3)))
threshold<-13.5
truepositive<-sum(sdcomposite>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sdcomposite<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity<-truepositive/length(sdcomposite)
specificity<-truenegative/length(sdc)
print(c(sensitivity,specificity))
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928 72 16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000
Nehmen wir an, wir arbeiten mit ambulanten Patienten und bekommen kranke Patienten nur ab dem D1-Anteil, oder wir arbeiten auf der Intensivstation, wo wir nur D3 bekommen. (Für einen allgemeineren Fall müssen wir auch die Gleichstromkomponente aufteilen.) Wie ändern sich unsere Sensitivität und Spezifität? Durch Ändern der Prävalenz (dh durch Ändern des relativen Anteils der Patienten, die zu beiden Fällen gehören, ändern wir die Spezifität und Sensitivität überhaupt nicht. Es kommt nur so vor, dass sich diese Prävalenz auch mit der Änderung der Verteilung ändert).
sdc<-sample(dc,0.1*length(dc))
sd1<-sample(d1,0.1*length(d1))
truepositive<-sum(sd1>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sd1<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity1<-truepositive/length(sd1)
specificity1<-truenegative/length(sdc)
print(c(sensitivity1,specificity1))
sdc<-sample(dc,0.1*length(dc))
sd3<-sample(d3,0.1*length(d3))
truepositive<-sum(sd3>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sd3<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity3<-truepositive/length(sd3)
specificity3<-truenegative/length(sdc)
print(c(sensitivity3,specificity3))
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1] 38 931 69 12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1] 30 944 56 0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944
Zusammenfassend lässt sich sagen, dass ein Diagramm zur Darstellung der Änderung der Sensitivität (die Spezifität würde einem ähnlichen Trend folgen, wenn wir auch die DC-Population aus Subpopulationen zusammengesetzt hätten) mit variierendem Mittelwert x für die Population ein Diagramm darstellt
df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3)))
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))
- Wenn es kein Proxy ist, hätten wir technisch eine 100% ige Spezifität und Sensitivität. Nehmen wir zum Beispiel an, wir definieren als ein bestimmtes objektiv definiertes pathologisches Bild bei der Leberbiopsie, dann wird der Leberbiopsietest zum Goldstandard und unsere Empfindlichkeit würde an sich selbst gemessen und ergibt somit 100%D
Wie bereits von anderen gesagt, hängen Sensitivität und Spezifität nicht von der Prävalenz ab. Die Sensitivität ist der Anteil der echten Positiven an allen Positiven und die Spezifität ist der Anteil der echten Negative an allen Negativen. Wenn also die Empfindlichkeit 90% beträgt, ist der Test in 90% der positiven Fälle korrekt. Offensichtlich sind 90% von etwas Kleinerem und 90% von etwas Größerem immer noch 90% ...
Angesichts der von Ihnen erwähnten tabellarischen Daten
Die Empfindlichkeit ist (von Die Definition der bedingten Wahrscheinlichkeit ) und der Spezifität ist . Für jede der Metriken wird jeweils nur eine der Spalten angezeigt, sodass die Prävalenz (relative Größe der Spalten) für diese Metriken keine Rolle spielt. Die Prävalenz kommt nicht in die Gleichungen. Es wäre auch ziemlich seltsam, wenn die "praktische" Empfindlichkeit anders als theoretisch definiert würde und zu unterschiedlichen Schlussfolgerungen führen würde.aa+b+c+d/a+ba+b+c+d=aa+b p(Y∣X)=p(Y∩X)p(X) da+b+c+d/c+da+b+c+d=dc+d
Das Zitat scheint aber auch etwas anderes zu sagen
Die Autoren sagen, dass die Empfindlichkeit in verschiedenen Gruppen unterschiedlich ist. Ich vermute, dass sich stationäre und ambulante Patienten in vielen Aspekten unterscheiden können, nicht nur in der Prävalenz allein, so dass einige andere Faktoren die Empfindlichkeit beeinflussen können. Also Ich bin damit einverstanden , dass sie können zwischen verschiedenen Datensatz ändern, die in der Prävalenz unterscheiden, aber die Änderung (wie gezeigt nicht eine Funktion der Prävalenz selbst sein @gung in seiner Antwort).
Andererseits, wenn ich raten müsste, verwechseln die Autoren vielleicht die Sensibilität mit der posterioren Wahrscheinlichkeit . Die Empfindlichkeit ist , während die hintere Wahrscheinlichkeit istp(positive test∣condition)
und in vielen Fällen ist dies die Wahrscheinlichkeit, an der die Menschen interessiert sind ("Wie wahrscheinlich ist es, dass ein Patient mit einem positiven Testergebnis tatsächlich an der Krankheit leidet?"), und sie hängt von der Prävalenz ab. Beachten Sie, dass in Ihrem Link auch die Auswirkungen der Prävalenz auf den positiven Vorhersagewert, dh die hintere Wahrscheinlichkeit, und nicht auf die Empfindlichkeit erläutert werden.
quelle
Siehe meine Antwort hier zu wahren / falschen positiven / negativen Raten.
Die Empfindlichkeit ist nur ein anderer Name für die wahre positive Rate, und die Spezifität entspricht der tatsächlichen negativen Rate. Sowohl Sensitivität als auch Spezifität sind bedingte Wahrscheinlichkeiten; Sie hängen vom Krankheitsstatus des Patienten ab. Daher ist die Prävalenz der Krankheit (dh die a priori Wahrscheinlichkeit, dass ein Patient an der Krankheit leidet) irrelevant, da Sie von einem bestimmten Krankheitszustand ausgehen.
Ich kann nicht kommentieren, warum der Lehrbuchautor behauptet, dass Sensitivität und Spezifität vom klinischen Kontext abhängen. Sind das empirische Beobachtungen?
quelle
Ich kann natürlich nicht mit den Absichten des Autors sprechen, aber hier wäre meine Begründung für diese Aussage:
Betrachten Sie den klinischen Kontext als diagnostischen Test. Eine mit sehr geringer Sensitivität und Spezifität, aber dennoch einem Test. Wenn Sie im Krankenhaus sind, sind Sie wahrscheinlich krank. Wenn Sie nicht im Krankenhaus sind, sind Sie wahrscheinlich nicht krank.
Aus dieser Perspektive ist der eigentliche Diagnosetest, den Sie durchführen, der zweite Teil von zwei seriellen Tests.
quelle
Das muss ein Fehler sein. Ich denke, der Autor versucht vielleicht vorzuschlagen, dass der positive und negative Vorhersagewert (PPV und NPV) von der Prävalenz (sowie von Sensitivität und Spezifität) abhängt. Diese werden oft mit diagnostischen Tests besprochen und sind für einen Kliniker vielleicht wertvoller als eine rohe Interpretation von Sensitivität und Spezifität.
Diese Grafik zeigt die Beziehung zwischen PPV und NPV mit der Prävalenz für einen Test mit 95% Sensitivität und 85% Spezifität.
Von Mausner JS, Kramer S: Mausner- und Bahn-Epidemiologie: Ein Einführungstext. Philadelphia, WB Saunders, 1985, p. 221.
quelle
@Satwik, @gung und @Tim haben bereits viele Details geliefert, aber ich werde versuchen, ein kleines Beispiel hinzuzufügen, wie der Fall der zugrunde liegenden Faktoren einen solchen Effekt verursachen kann.
Ein Schlüsselprinzip: Bias
Sensitivität / Spezifität und ALLE statistischen Tests haben dieselbe Einschränkung: Sie gelten nur für die unvoreingenommene Wiederholung des gleichen Probenahmeverfahrens wie zuvor.
Krankenhäuser sind funktionierende Organisationen, die voreingenommene Stichproben durchführen und Zulassungsrichtlinien verwenden, um die allgemeine Bevölkerung in diejenigen zu filtern, die eine Aufnahme und Behandlung benötigen. Dies ist ein Gegensatz zum wissenschaftlichen Verfahren. Wenn Sie wissen möchten, wie ein Test in verschiedenen Populationen durchgeführt wird, muss er in verschiedenen Populationen getestet werden.
Der latente Effekt: Korrelation
Es ist selten (oder in der realen Welt unmöglich, wenn Sie streng sein möchten), dass eine Diagnose unabhängig / orthogonal zu allen anderen Risikofaktoren für eine Krankheit ist, sodass ein gewisser Grad an Korrelation besteht.
Wenn der Bildschirm für die Aufnahme in ein Krankenhaus positiv mit der Diagnose korreliert, werden Sie feststellen, dass Personen, die den Aufnahmetest bestehen, für positive Ergebnisse durch die Diagnose positiv prädisponiert sind, proportional zur Korrelation. Somit werden wahre Positive angereichert und falsche Negative um Beträge reduziert, die proportional zur Korrelation sind.
Dadurch erscheint die Empfindlichkeit größer.
Die Erklärung des Phänomens
Eine Beobachtung, dass die Empfindlichkeit in einem Krankenhauskontext höher sein kann, ist daher nicht unrealistisch. In der Tat, wenn die Zulassungsrichtlinie gut durchdacht und zweckmäßig ist, würde man erwarten, dass dies geschieht.
Es ist kein Hinweis auf eine Aufschlüsselung der Annahme, dass Sensitivität und Spezifität unabhängig von der Prävalenz sind, sondern ein Hinweis auf eine voreingenommene Stichprobe auf der Grundlage der Krankenhauszulassungsrichtlinie.
Was angesichts der Tatsache, dass ein Krankenhaus dazu dient, Menschen zu behandeln und keine wissenschaftlichen Experimente durchzuführen, definitiv eine gute Sache ist.
Aber es bereitet Wissenschaftlern Kopfschmerzen.
quelle