Ich verwende eine Verwirrungsmatrix , um die Leistung meines Klassifikators zu überprüfen.
Ich benutze Scikit-Learn und bin etwas verwirrt. Wie kann ich das Ergebnis von interpretieren?
from sklearn.metrics import confusion_matrix
>>> y_true = [2, 0, 2, 2, 0, 1]
>>> y_pred = [0, 0, 2, 2, 0, 2]
>>> confusion_matrix(y_true, y_pred)
array([[2, 0, 0],
[0, 0, 1],
[1, 0, 2]])
Wie kann ich die Entscheidung treffen, ob diese vorhergesagten Werte gut sind oder nicht?
predictive-models
prediction
confusion-matrix
user3378649
quelle
quelle
Antworten:
Mit der Verwirrungsmatrix kann die Anzahl der Fehlklassifizierungen, dh die Anzahl der vorhergesagten Klassen, die auf der Grundlage der wahren Klassen in einen falschen Klassifizierungsbereich gelangt sind, tabellarisch dargestellt werden.
Während sklearn.metrics.confusion_matrix eine numerische Matrix bereitstellt, finde ich es sinnvoller, einen "Bericht" mit den folgenden Methoden zu erstellen:
was in ... endet:
Dies ermöglicht es uns zu sehen, dass:
y_true
undy_pred
aus den Zwischensummen "Alle"Diese Methode funktioniert auch für Textbeschriftungen und kann für eine große Anzahl von Beispielen im Dataset erweitert werden, um Prozentberichte bereitzustellen.
Die Ausgabe ist dann:
wobei die Zahlen jetzt den Prozentsatz (und nicht die Anzahl der Fälle) der klassifizierten Ergebnisse darstellen.
Beachten Sie jedoch, dass die
sklearn.metrics.confusion_matrix
Ausgabe direkt visualisiert werden kann mit:quelle
AssertionError: arrays and names must have the same length
y_pred = pd.Series(...)
. Das sollte jetzt funktionieren.Auf der y-Achse hat die Verwirrungsmatrix die tatsächlichen Werte und auf der x-Achse die vom Prädiktor angegebenen Werte. Daher sind die Zählungen auf der Diagonale die Anzahl der korrekten Vorhersagen. Und Elemente der Diagonale sind falsche Vorhersagen.
In Ihrem Fall:
quelle
Ich möchte die Notwendigkeit, dies zu verstehen, grafisch spezifizieren. Es ist eine einfache Matrix, die gut verstanden werden muss, bevor man zu Schlussfolgerungen kommt. Hier ist eine vereinfachte, erklärbare Version der obigen Antworten.
quelle