Das Bild unten zeigt eine kontinuierliche Kurve von falsch-positiven Raten gegenüber wahr-positiven Raten:
Ich verstehe jedoch nicht sofort, wie diese Sätze berechnet werden. Wenn eine Methode auf einen Datensatz angewendet wird, weist sie eine bestimmte FP-Rate und eine bestimmte FN-Rate auf. Bedeutet das nicht, dass jede Methode einen einzelnen Punkt anstelle einer Kurve haben sollte? Natürlich gibt es mehrere Möglichkeiten, eine Methode zu konfigurieren und mehrere verschiedene Punkte zu erzeugen, aber mir ist nicht klar, wie es dieses Kontinuum von Raten gibt oder wie es erzeugt wird.
Antworten:
Die Darstellung ist eine ROC-Kurve und die Punkte (False Positive Rate, True Positive Rate) werden für verschiedene Schwellenwerte berechnet. Angenommen, Sie haben eine einheitliche Nutzfunktion, dann ist der optimale Schwellenwert derjenige für den Punkt, der am nächsten an (0, 1) liegt.
quelle
So generieren Sie ROC-Kurven (= Receiver Operating Characteristic Curves):
Angenommen, wir haben einen probabilistischen, binären Klassifikator wie die logistische Regression. Vor der Darstellung der ROC-Kurve muss das Konzept der Verwirrungsmatrix verstanden werden. Wenn wir eine binäre Vorhersage machen, kann es 4 Arten von Fehlern geben:
Um die Verwirrungsmatrix zu erhalten, gehen wir alle vom Modell gemachten Vorhersagen durch und zählen, wie oft jeder dieser vier Fehlertypen auftritt:
In diesem Beispiel einer Verwirrungsmatrix werden von den 50 klassifizierten Datenpunkten 45 korrekt klassifiziert und die 5 falsch klassifiziert.
Da es für den Vergleich zweier verschiedener Modelle oft praktischer ist, eine einzige Metrik anstelle mehrerer zu haben, berechnen wir zwei Metriken aus der Verwirrungsmatrix, die wir später zu einer kombinieren werden:
In dieser Abbildung entspricht der blaue Bereich dem Bereich unter der Kurve der Empfänger-Betriebskennlinie (AUROC). Die gestrichelte Linie in der Diagonale zeigt die ROC-Kurve eines zufälligen Prädiktors: Sie hat eine AUROC von 0,5. Der zufällige Prädiktor wird üblicherweise als Basis verwendet, um festzustellen, ob das Modell nützlich ist.
Wenn Sie Erfahrungen aus erster Hand sammeln möchten:
quelle
Mortens Antwort adressiert die Frage im Titel richtig - die Zahl ist in der Tat eine ROC-Kurve. Es wird erstellt, indem eine Folge von falsch-positiven Raten (FPR) gegen die entsprechenden wahr-positiven Raten geplottet wird.
Ich möchte jedoch auf die Frage antworten, die Sie in Ihrem Beitrag stellen.
Viele Methoden des maschinellen Lernens haben einstellbare Parameter. Beispielsweise ist die Ausgabe einer logistischen Regression eine vorhergesagte Wahrscheinlichkeit einer Klassenzugehörigkeit. Eine Entscheidungsregel zum Klassifizieren aller Punkte mit vorhergesagten Wahrscheinlichkeiten über einem bestimmten Schwellenwert für eine Klasse und der Rest für eine andere Klasse kann einen flexiblen Bereich von Klassifizierern mit jeweils unterschiedlichen TPR- und FPR-Statistiken erstellen. Das Gleiche kann im Fall von zufälligen Wäldern durchgeführt werden, bei denen die Stimmen der Bäume berücksichtigt werden, oder bei SVM, bei denen die signierte Entfernung von der Hyperebene berücksichtigt wird.
Wenn Sie eine Kreuzvalidierung durchführen, um die Leistung außerhalb der Stichprobe abzuschätzen, wird in der Regel anhand der Vorhersagewerte (Stimmen, Wahrscheinlichkeiten, vorzeichenbehaftete Abstände) eine Folge von TPR und FPR generiert. Dies sieht normalerweise wie eine Sprungfunktion aus, da in der Regel nur ein Punkt von TP nach FN oder von FP nach FN bei jedem vorhergesagten Wert verschoben wird (dh alle außerhalb der Stichprobe vorhergesagten Werte sind eindeutig). In diesem Fall sind die TPR- und FPR-Funktionen nicht kontinuierlich , obwohl es ein Kontinuum von Optionen für die Berechnung von TPR und FPR gibt, da es nur endlich viele Punkte außerhalb des Abtastwerts gibt, sodass die resultierenden Kurven ein stufenartiges Aussehen haben .
quelle
Aus Wikipedia:
Sie können sich die beiden Achsen als Kosten vorstellen, die anfallen müssen, damit der Binärklassifikator funktioniert. Idealerweise möchten Sie eine möglichst niedrige Falsch-Positiv-Rate für eine möglichst hohe True-Positiv-Rate erzielen. Das heißt, Sie möchten, dass der Binärklassifizierer so wenig False Positives wie möglich für so viele True Positives aufruft.
Um es konkret zu machen, stellen Sie sich einen Klassifikator vor, der durch Messung der Menge eines Biomarkers erkennen kann, ob eine bestimmte Krankheit vorliegt. Stellen Sie sich vor, der Biomarker hätte einen Wert im Bereich von 0 (nicht vorhanden) bis 1 (gesättigt). Welche Stufe maximiert die Erkennung der Krankheit? Es könnte der Fall sein, dass der Biomarker ab einem gewissen Grad einige Menschen als krank einstuft, die Krankheit jedoch nicht haben. Dies sind falsche Positive. Dann gibt es natürlich diejenigen, die als erkrankt eingestuft werden, wenn sie tatsächlich erkrankt sind. Dies sind die wahren Vorteile.
Der ROC bewertet den Anteil der wahren Positiven aller Positiven gegenüber dem Anteil der falschen Positiven unter Berücksichtigung aller möglichen Schwellenwerte.
quelle