Grenzwert in einer ROC-Kurve. Gibt es eine einfache Funktion?

10

Ich möchte den Grenzwert für das Geschlecht anhand einer anthropologischen Messung ermitteln. Ich kann die Kurven zeichnen und weiß, dass für den Fall, dass sowohl Sensitivität als auch Spezifität ähnlich wichtig sind, der Punkt bestimmt werden sollte, der der oberen linken Ecke des Rahmens am nächsten liegt (oder wenn die Kurve negativ ist, der Punkt, der der unteren rechten Ecke am nächsten liegt) als Cut-Off.

Ich weiß jedoch nicht, ob es in R oder anderen Programmen bereits eine implementierte Funktion gibt, um dies einfach zu bestimmen. Ich weiß nur, dass SPSS keine solche Funktion hat. Kennen Sie Programme oder R, die dies über eine bereits implementierte Funktion tun können?

Vic
quelle
3
Hallo @Vic. Für diese Art von Berechnungen gibt es ein ausgezeichnetes RPaket ROCR. Finden Sie es hier . Siehe auch die entsprechende Site mit einer umfassenden Dokumentation. Es gibt auch ein Papier über das Paket .
COOLSerdash

Antworten:

12

Sie möchten den Youden-Index berechnen und den höchsten in Ihrer ROC-Kurve finden.

Werfen Sie einen Blick auf die OptimalCutpoints und cutpointr Pakete für R. Wenn Sie ROC - Analyse tun, Sie auch die verwenden können , in coordsAbhängigkeit von proc (ein wenig Eigenwerbung hier):

library(pROC)
data(aSAH)
rocobj <- roc(aSAH$outcome, aSAH$s100b)
coords(rocobj, "best")
coords(rocobj, x="best", input="threshold", best.method="youden") # Same than last line
Calimo
quelle
4

Wie @COOLSerdash erwähnte, gibt es ein gutes R-Paket ROCR für diese Art der Analyse.

Meine Antwort ist jedoch, dass es nicht möglich ist, eine Cut-Off-Entscheidung nur auf der Grundlage einer Informationsmetrik zu treffen.

Sie sollten eine echte Verlustfunktion angeben, deren Parameter auf einem relativen Wert verschiedener Fehlklassifizierungen basieren. Es ist dann einfach, einen Grenzwert auszuwählen, der Gewinne maximiert oder Verluste minimiert.

Analytiker
quelle
1
Gut gesagt. Sie müssen sich auch fragen, welchen Wert ein Cutoff hat, wenn Sie das vorhergesagte Risiko nur für ein Kontinuum verwenden können.
Frank Harrell
1
Vic schreibt, dass "Sensitivität und Spezifität beide ähnlich wichtig sind", was ich als identische Kosten für die verschiedenen Fehlklassifizierungen interpretiere. In diesem Fall ist eine einfache Kostenfunktion wie der Youden-Index angemessen (dies ist jedoch im Allgemeinen nicht der Fall).
Calimo