Wenn Sie die Definitionen von Präzision (auch bekannt als positiver Vorhersagewert PPV) und Rückruf (auch bekannt als Sensitivität) formulieren, sehen Sie, dass sie sich auf eine Klasse beziehen, unabhängig von anderen Klassen:
Rückruf oder Empfindlichkeit ist der Anteil der Fälle, die korrekt als zur Klasse c gehörend identifiziert wurden, unter allen Fällen, die tatsächlich zur Klasse c gehören .
(Wenn wir einen Fall haben, der wirklich zu " c " gehört, wie hoch ist die Wahrscheinlichkeit, dies richtig vorherzusagen?)
Präzisions- oder positiver Vorhersagewert PPV ist der Anteil der Fälle, die korrekt als zur Klasse c gehörend identifiziert wurden, unter allen Fällen, von denen der Klassifizierer behauptet, dass sie zur Klasse c gehören .
Mit anderen Worten, von den Fällen, von denen vorhergesagt wird , dass sie zur Klasse c gehören , welcher Bruchteil gehört wirklich zur Klasse c ? (Wie groß ist angesichts der Voraussage " c " die Wahrscheinlichkeit, korrekt zu sein?)
negativer Vorhersagewert NPV der Fälle, von denen vorhergesagt wurde, dass sie nicht zur Klasse c gehören. Welcher Bruchteil gehört wirklich nicht zur Klasse c ? (Wie groß ist die Wahrscheinlichkeit, korrekt zu sein, wenn die Vorhersage "nicht c " getroffen wird?)
So können Sie die Genauigkeit und den Rückruf für jede Ihrer Klassen berechnen. Bei Verwirrungstabellen mit mehreren Klassen sind dies die diagonalen Elemente, die durch ihre Zeilen- bzw. Spaltensummen geteilt werden:
Quelle: Beleites, C.; Salzer, R. & Sergo, V. Validierung von Soft-Klassifikationsmodellen unter Verwendung von Teilklassenmitgliedschaften: Ein erweitertes Konzept von Sensitivität & Co. angewendet auf die Einstufung von Astrozytomgeweben, Chemom Intell Lab Syst, 122, 12 - 22 (2013). DOI: 10.1016 / j.chemolab.2012.12.003
Indem Sie die Daten auf erzwungene Entscheidungen (Klassifizierung) reduzieren und nicht aufzeichnen, ob es sich um "enge Anrufe" handelt, erhalten Sie statistische Schätzungen mit minimaler Genauigkeit und minimaler Genauigkeit. Außerdem nehmen Sie heimlich eine seltsame Nutzen- / Verlust- / Kostenfunktion an und verwenden beliebige Schwellenwerte . Es wäre weitaus besser, maximale Informationen zu verwenden, die die Wahrscheinlichkeiten einer Klassenmitgliedschaft und keine erzwungenen Entscheidungen einschließen.
quelle
Der einfachste Weg ist, Confusion_matrix überhaupt nicht zu verwenden. Verwenden Sie Klassifizierung_Report (), es gibt Ihnen alles, was Sie jemals gebraucht haben, Prost ...
Bearbeiten:
Dies ist das Format für confusion_matrix ():
[[TP, FN]
[FP, TN]]
Und der Klassifizierungsbericht gibt all dies an
quelle
Wenn Sie einfach nur das Ergebnis erzielen möchten, würde ich Ihnen raten, nicht zu viel über die Ihnen zur Verfügung stehenden Werkzeuge nachzudenken und sie zu verwenden. Hier erfahren Sie, wie Sie dies in Python tun können.
Um die folgende Ausgabe zu erhalten
quelle
Das Folgende ist ein Beispiel für eine Mehrklassen-Verwirrungsmatrix, bei der angenommen wird, dass unsere Klassenbezeichnungen A, B und C sind
A / P A B C Summe
A 10 3 4 17
B 2 12 6 20
C 6 3 9 18
Summe 18 18 19 55
Jetzt berechnen wir jeweils drei Werte für Precision und Recall und nennen sie Pa, Pb und Pc. und ähnlich Ra, Rb, Rc.
Wir wissen, dass Präzision = TP / (TP + FP) ist, also wird für Pa wahres Positiv das tatsächliche A sein, das als A vorhergesagt wird, dh 10, der Rest der beiden Zellen in dieser Spalte, ob es B oder C ist, macht falsch positiv. So
Pa = 10/18 = 0,55 Ra = 10/17 = 0,59
Jetzt sind Präzision und Rückruf für Klasse B Pb und Rb. Für die Klasse B ist wahr positiv das tatsächliche B, das als B vorhergesagt wird, dh die Zelle, die den Wert 12 enthält, und der Rest der beiden Zellen in dieser Spalte machen also falsch positiv
Pb = 12/18 = 0,67 Rb = 12/20 = 0,6
In ähnlicher Weise ist Pc = 9/19 = 0,47 Rc = 9/18 = 0,5
Die Gesamtleistung des Klassifikators wird durch durchschnittliche Präzision und durchschnittlichen Rückruf bestimmt. Dazu multiplizieren wir den Genauigkeitswert für jede Klasse mit der tatsächlichen Anzahl von Instanzen für diese Klasse, addieren sie dann und teilen sie durch die Gesamtzahl der Instanzen. Mögen ,
Durchschnittliche Präzision = (0,55 * 17 + 0,67 * 20 + 0,47 * 18) / 55 = 31,21 / 55 = 0,57 Durchschnittlicher Rückruf = (0,59 * 17 + 0,6 * 20 + 0,5 * 18) / 55 = 31,03 / 55 = 0,56
Ich hoffe, es hilft
quelle