Angenommen, eine Kreuzklassifizierung wie die unten gezeigte (hier für ein Screening-Instrument)
Wir können vier Maße für die Screening-Genauigkeit und die Vorhersagekraft definieren:
- Empfindlichkeit (se), a / (a + c), dh die Wahrscheinlichkeit, dass der Screen bei Vorliegen einer Krankheit ein positives Ergebnis liefert;
- Spezifität (sp), d / (b + d), dh die Wahrscheinlichkeit, dass der Screen bei Abwesenheit einer Krankheit ein negatives Ergebnis liefert;
- Positiver Vorhersagewert (PPV), a / (a + b), dh die Wahrscheinlichkeit von Patienten mit positiven Testergebnissen, die korrekt diagnostiziert wurden (als positiv);
- Negativer Vorhersagewert (NPV), d / (c + d), dh die Wahrscheinlichkeit von Patienten mit negativen Testergebnissen, die korrekt diagnostiziert wurden (als negativ).
Jeweils vier Kennzahlen sind einfache Proportionen, die aus den beobachteten Daten berechnet werden. Ein geeigneter statistischer Test wäre daher ein binomischer (exakter) Test , der in den meisten statistischen Paketen oder in vielen Online-Rechnern verfügbar sein sollte. Die getestete Hypothese ist, ob sich die beobachteten Anteile signifikant von 0,5 unterscheiden oder nicht. Ich fand es jedoch interessanter, Konfidenzintervalle anstelle eines einzelnen Signifikanztests bereitzustellen, da dies eine Information über die Genauigkeit der Messung liefert. Um die von Ihnen angezeigten Ergebnisse zu reproduzieren, müssen Sie die Gesamtränder Ihrer Zwei-Wege-Tabelle kennen (Sie haben nur den PPV und den NPV in% angegeben).
Nehmen wir als Beispiel an, wir betrachten die folgenden Daten (der CAGE-Fragebogen ist ein Screening-Fragebogen für Alkohol):
dann würde in R der PPV wie folgt berechnet:
> binom.test(99, 142)
Exact binomial test
data: 99 and 142
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.6145213 0.7714116
sample estimates:
probability of success
0.6971831
Wenn Sie SAS verwenden, lesen Sie den Verwendungshinweis 24170: Wie kann ich Sensitivität, Spezifität, positive und negative Vorhersagewerte, falsch positive und negative Wahrscheinlichkeiten sowie die Wahrscheinlichkeitsverhältnisse abschätzen? .
Um Konfidenzintervalle zu berechnen, ist die Gaußsche Näherung (1,96 ist das Quantil der Standardnormalverteilung bei oder mit %) wird in der Praxis verwendet, insbesondere wenn die Anteile sehr klein oder groß sind (was hier häufig der Fall ist).p ± 1,96 × p ( 1 - p ) / n---------√p = 0,9751 - α / 2α = 5
Als weitere Referenz können Sie anschauen
Newcombe, RG. Zweiseitige Konfidenzintervalle für das einzelne Verhältnis: Vergleich von sieben Methoden .
Statistics in Medicine , 17, 857 & ndash; 872 (1998).
Bitte sehen Sie
Kosinski, Andrzej S. Eine gewichtete generalisierte Score-Statistik zum Vergleich von Vorhersagewerten diagnostischer Tests. Statistik in der Medizin http://dx.doi.org/10.1002/sim.5587 online veröffentlicht: 22. AUG 2012
quelle