Statistischer Test für positiven und negativen Vorhersagewert

12

Ich las eine Zeitung durch und sah eine Tabelle mit einem Vergleich zwischen PPV (Positive Predictive Value) und NPV (Negative Predictive Value). Sie haben eine Art statistischen Test für sie durchgeführt, dies ist eine Skizze der Tabelle:

PPV    NPV    p-value
65.9   100    < 0.00001
...

Jede Zeile bezieht sich auf eine bestimmte Kontingenztabelle.

Welche Art von Hypothesentest haben sie gemacht? Vielen Dank!

Simone
quelle

Antworten:

17

Angenommen, eine Kreuzklassifizierung wie die unten gezeigte (hier für ein Screening-Instrument)

Alt-Text

Wir können vier Maße für die Screening-Genauigkeit und die Vorhersagekraft definieren:

  • Empfindlichkeit (se), a / (a ​​+ c), dh die Wahrscheinlichkeit, dass der Screen bei Vorliegen einer Krankheit ein positives Ergebnis liefert;
  • Spezifität (sp), d / (b + d), dh die Wahrscheinlichkeit, dass der Screen bei Abwesenheit einer Krankheit ein negatives Ergebnis liefert;
  • Positiver Vorhersagewert (PPV), a / (a ​​+ b), dh die Wahrscheinlichkeit von Patienten mit positiven Testergebnissen, die korrekt diagnostiziert wurden (als positiv);
  • Negativer Vorhersagewert (NPV), d / (c + d), dh die Wahrscheinlichkeit von Patienten mit negativen Testergebnissen, die korrekt diagnostiziert wurden (als negativ).

Jeweils vier Kennzahlen sind einfache Proportionen, die aus den beobachteten Daten berechnet werden. Ein geeigneter statistischer Test wäre daher ein binomischer (exakter) Test , der in den meisten statistischen Paketen oder in vielen Online-Rechnern verfügbar sein sollte. Die getestete Hypothese ist, ob sich die beobachteten Anteile signifikant von 0,5 unterscheiden oder nicht. Ich fand es jedoch interessanter, Konfidenzintervalle anstelle eines einzelnen Signifikanztests bereitzustellen, da dies eine Information über die Genauigkeit der Messung liefert. Um die von Ihnen angezeigten Ergebnisse zu reproduzieren, müssen Sie die Gesamtränder Ihrer Zwei-Wege-Tabelle kennen (Sie haben nur den PPV und den NPV in% angegeben).

Nehmen wir als Beispiel an, wir betrachten die folgenden Daten (der CAGE-Fragebogen ist ein Screening-Fragebogen für Alkohol):

Alt-Text

dann würde in R der PPV wie folgt berechnet:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831 

Wenn Sie SAS verwenden, lesen Sie den Verwendungshinweis 24170: Wie kann ich Sensitivität, Spezifität, positive und negative Vorhersagewerte, falsch positive und negative Wahrscheinlichkeiten sowie die Wahrscheinlichkeitsverhältnisse abschätzen? .

Um Konfidenzintervalle zu berechnen, ist die Gaußsche Näherung (1,96 ist das Quantil der Standardnormalverteilung bei oder mit %) wird in der Praxis verwendet, insbesondere wenn die Anteile sehr klein oder groß sind (was hier häufig der Fall ist).p±1,96×p(1-p)/np=0,9751-α/2α=5

Als weitere Referenz können Sie anschauen

Newcombe, RG. Zweiseitige Konfidenzintervalle für das einzelne Verhältnis: Vergleich von sieben Methoden . Statistics in Medicine , 17, 857 & ndash; 872 (1998).

chl
quelle
Vielen Dank. Ok, ich habe ganz am Anfang der Arbeit gelesen, dass sie den Chi-Quadrat-Test für alle kategorialen Variablen verwendet haben. Die geschriebene Klassifikationstabelle bezieht sich nicht auf eine bestimmte Variable, sondern ist die Ausgabe einer Klassifikationsaufgabe. Es ist nicht sehr klar! Jetzt haben sie wohl einen klassischen Proportionstest gemacht ... vielleicht Chi-Quadrat ...
Simone
Ich habe mir diese Frage noch einmal angesehen und festgestellt, dass sich der p-Wert weder auf PPV noch auf NPV bezieht, sondern auf die gesamte Zeile. Ich denke, der Test, den sie hatten, sollte mit der gesamten Kontingenztabelle in Verbindung gebracht werden.
Simone
@ Simone Also, wenn ich Sie richtig verstehe, schlagen Sie vor, dass die Autoren PPV- und NPV-Werte angeben, aber den p-Wert angeben, der einem globalen Assoziationstest der 2x2-Tabelle entspricht? Hängt es mit dieser neuen Frage zusammen, stats.stackexchange.com/questions/9464/… ?
Chl
Ja, es wäre mit dieser Frage verbunden, wenn der p-Wert entweder mit dem PPV oder dem NPV in Verbindung gebracht würde. Und in diesem Fall gaben Sie die Lösung. Der Test entspricht der gesamten 2x2-Tabelle, ich werde nie wissen, um welche Art von Test es sich handelt!
Simone
1

Bitte sehen Sie

Kosinski, Andrzej S. Eine gewichtete generalisierte Score-Statistik zum Vergleich von Vorhersagewerten diagnostischer Tests. Statistik in der Medizin http://dx.doi.org/10.1002/sim.5587 online veröffentlicht: 22. AUG 2012

Andrzej Kosinski
quelle