Mittelung der Präzision und des Rückrufs bei Verwendung der Kreuzvalidierung

11

Ich habe eine Klassifizierung unter Verwendung mehrerer Klassifizierer für Daten mit 2 Klassen durchgeführt und eine 5-fache Kreuzvalidierung verwendet. Für jede Falte berechnete ich tp, tn, fp und fn. Dann berechnete ich die Genauigkeit, Präzision, Rückruf und F-Punktzahl für jeden Test. Meine Frage ist, wenn ich die Ergebnisse mitteln möchte, habe ich den Durchschnitt der Genauigkeiten genommen, aber kann ich auch die Präzision, den Rückruf und den F-Score mitteln? Oder wäre das mathematisch falsch? PS Die in jeder Falte verwendeten Datensätze sind in Bezug auf die Anzahl der Instanzen pro Klasse gut ausgewogen.

Vielen Dank.

Kalaji
quelle
3
Ich bin auf dasselbe Problem bei der Berechnung des F-Maßes (harmonisches Mittel der Präzision und des Rückrufs) mithilfe der Kreuzvalidierung gestoßen. In diesem Artikel haben sie tatsächlich gezeigt, dass die Berechnung des F-Maßes für den gesamten Satz und nicht die Mittelung die weniger voreingenommene Methode ist. Ich hoffe, das kann helfen
Papafe
3
@markusian Bitte füge dies als Antwort hinzu! Es ist bei weitem das Wichtigste auf dieser Seite !!
Drevicko

Antworten:

2

F.

F.1=2PräzisionerinnernPräzision+erinnern
F.ββ
F.β=(1+β2)Präzisionerinnern(β2Präzision)+erinnern
F.

tF.F.

Matt Krause
quelle
Ja, ich habe die erste Formel verwendet. Dies bedeutet, dass die Mittelung des F-Scores aus den verschiedenen Tests ähnliche Ergebnisse liefert wie die Mittelung der Genauigkeit und des Abrufs und die anschließende Berechnung des F-Scores aus diesen. Ich habe es mit den Ergebnissen versucht, die ich habe, und es war fast das gleiche. Vielen Dank.
Kalaji