Verbindungen zwischen

13

Beim maschinellen Lernen können wir den Bereich unter der ROC-Kurve (oft als AUC oder AUROC abgekürzt ) verwenden, um zusammenzufassen, wie gut ein System zwischen zwei Kategorien unterscheiden kann. In der Signaldetektionstheorie wird häufig der d' (Empfindlichkeitsindex) für einen ähnlichen Zweck verwendet. Die beiden sind eng miteinander verbunden, und ich glaube, dass sie einander gleichwertig sind, wenn bestimmte Annahmen erfüllt sind .

Die Berechnung wird normalerweise unter der Annahme von Normalverteilungen für die Signalverteilungen dargestellt (siehe z. B. Wikipedia-Link oben). Die ROC-Kurvenberechnung geht nicht von dieser Annahme aus: Sie gilt für jeden Klassifizierer, der ein Entscheidungskriterium mit kontinuierlichem Wert ausgibt, das mit einem Schwellenwert versehen werden kann.d'

Wikipedia sagt , dass entspricht 2 AUC - 1 . Dies scheint richtig zu sein, wenn die Annahmen beider erfüllt sind; aber wenn die Annahmen nicht gleich sind, ist es keine universelle Wahrheit.d'2AUC- -1

d'd'

Dan Stowell
quelle

Antworten:

7

Nein. Der Maximalwert der AUC ist 1. d 'hat kein Maximum.

Ich glaube, dass d 'gleich qnorm (AUC) * sqrt (2) ist (meine Erinnerung an ein altes Statistikbuch, das ich momentan nicht finden kann, aber es scheint mit einigen Daten zu vergleichen, die ich im Web gefunden habe). Hier ist qnorm (x) die "Quantilfunktion für die Normalverteilung" (R-speak). Das heißt, es wird der Wert der Normalverteilung zurückgegeben, für die der x-Anteil der Verteilung darunter liegt.

Joel Lachter
quelle
2
Danke, das klingt für mich richtig - allerdings nur, wenn wir davon ausgehen, dass die Verteilungen normal sind (aufgrund der Verwendung von qnorm ()). Ich habe den Wikipedia-Wortlaut korrigiert.
Dan Stowell