Wie können wir eine ROC-Kurve für Entscheidungsbäume zeichnen?
13
Normalerweise können wir keine ROC-Kurve für die diskreten Klassifikatoren wie Entscheidungsbäume zeichnen. Habe ich recht? Gibt es eine Möglichkeit, eine ROC-Kurve für Dtrees zu zeichnen?
@rapaio Entschuldigung, Ihr Link zeigt eine ROC-Kurve, um einen Schwellenwert in einem Klassifikator zu finden, der eine Ausgabe zwischen 1 und 0 (kontinuierlicher Wert) erzeugt.
DataMiner
@ Sangram Dies sind die Lösungen in R, aber ich möchte nur verstehen, wie es funktioniert.
DataMiner
Antworten:
15
( x , y) = ( FPR , TPR )FPRTPR
Weitere Informationen zur Berechnung finden Sie auf der Wikipedia-Seite .
Für einen Entscheidungsbaum werden die Klassen immer noch mit einer gewissen Sicherheit vorhergesagt. Die Antwort wird bereits von @rapaio gegeben, aber ich werde es ein wenig erweitern.
Stellen Sie sich folgende Entscheidungsbaum (es ist ein bisschen modifizierte Version dieses ein )
An jedem Knoten befinden sich nicht nur die Beschriftungen der Mehrheitsklasse, sondern auch andere, die auf diesem Blatt landeten, sodass wir dem Blatt, auf dem wir die Beschriftung vorhersagen, den Grad an Sicherheit zuweisen können.
Betrachten Sie beispielsweise die folgenden Daten
Wir führen es aus und weisen die Bewertungen der Ausgabe zu, nicht den tatsächlichen Bezeichnungen. Damit können wir eine ROC-Kurve zeichnen, wie hier vorgeschlagen
Es ist jedoch wenig sinnvoll, damit Ihren Schwellenwert abzustimmen (da es in Decision Trees natürlich keinen Schwellenwert gibt), kann aber dennoch zur Berechnung der AUC verwendet werden, die in diesem Fall 0,92 beträgt
Antworten:
Weitere Informationen zur Berechnung finden Sie auf der Wikipedia-Seite .
quelle
Für einen Entscheidungsbaum werden die Klassen immer noch mit einer gewissen Sicherheit vorhergesagt. Die Antwort wird bereits von @rapaio gegeben, aber ich werde es ein wenig erweitern.
Stellen Sie sich folgende Entscheidungsbaum (es ist ein bisschen modifizierte Version dieses ein )
An jedem Knoten befinden sich nicht nur die Beschriftungen der Mehrheitsklasse, sondern auch andere, die auf diesem Blatt landeten, sodass wir dem Blatt, auf dem wir die Beschriftung vorhersagen, den Grad an Sicherheit zuweisen können.
Betrachten Sie beispielsweise die folgenden Daten
Wir führen es aus und weisen die Bewertungen der Ausgabe zu, nicht den tatsächlichen Bezeichnungen. Damit können wir eine ROC-Kurve zeichnen, wie hier vorgeschlagen
Es ist jedoch wenig sinnvoll, damit Ihren Schwellenwert abzustimmen (da es in Decision Trees natürlich keinen Schwellenwert gibt), kann aber dennoch zur Berechnung der AUC verwendet werden, die in diesem Fall 0,92 beträgt
Hier verwendeter R-Code:
quelle