Entspricht der Würfelkoeffizient der Genauigkeit?

12

Ich stoße auf den Würfelkoeffizienten für Volumenähnlichkeit ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) und Genauigkeit ( https://en.wikipedia.org/wiki/Accuracy_and_precision) ).

Es scheint mir, dass diese beiden Maßnahmen gleich sind. Irgendwelche Gedanken?

RockTheStar
quelle
1
Dies bietet alle Informationen stats.stackexchange.com/questions/195006/…
Rang 1
1
@ rank1 Danke. Ich möchte klarstellen:
Ist das
2
Hoppla, dieser hier: ncbi.nlm.nih.gov/pmc/articles/PMC4533825
Rang 1

Antworten:

18

Diese sind nicht dasselbe und werden häufig in unterschiedlichen Kontexten verwendet. Der Würfelwert wird häufig verwendet, um die Leistung von Bildsegmentierungsmethoden zu quantifizieren . Dort kommentieren Sie einen Grundwahrheitsbereich in Ihrem Bild und erstellen dann einen automatisierten Algorithmus, um dies zu tun. Sie validieren den Algorithmus, indem Sie die Würfelbewertung berechnen, die ein Maß dafür ist, wie ähnlich die Objekte sind. Es ist also die Größe der Überlappung der beiden Segmentierungen geteilt durch die Gesamtgröße der beiden Objekte. Unter Verwendung der gleichen Begriffe wie bei der Beschreibung der Genauigkeit lautet die Würfelbewertung:

Dice score=2number of true positives2number of true positives + number of false positives + number of false negatives

Der Würfelwert ist nicht nur ein Maß dafür, wie viele Positive Sie finden, sondern bestraft auch die falschen Positiven, die die Methode findet, ähnlich wie bei der Genauigkeit. Es ist also eher der Präzision als der Genauigkeit ähnlich. Der einzige Unterschied ist der Nenner, bei dem Sie die Gesamtzahl der Positiven anstelle der nur von der Methode gefundenen Positiven angeben. Der Würfel-Score bestraft also auch die positiven Ergebnisse, die Ihr Algorithmus / Ihre Methode nicht finden konnte.

AB

  • A
  • ABABAB
  • BA

Wenn Sie dies für eine Veröffentlichung tun, schreiben Sie Dice mit einem Großbuchstaben D, da es nach einem Typen namens Dice benannt ist.

BEARBEITEN: In Bezug auf den Kommentar zu einer Korrektur: Ich verwende nicht die traditionelle Formel, um den Würfelkoeffizienten zu berechnen, aber wenn ich ihn in die Notation in der anderen Antwort übersetze, wird er:

Dice score=2|AB|2|AB|+|BA|+|AB|

Welches entspricht der traditionellen Definition. Es ist bequemer, es so zu schreiben, wie ich es ursprünglich geschrieben habe, um die Formel in Form von Fehlalarmen anzugeben. Der Backslash ist das gesetzte Minus.

Gumeo
quelle
2
Danke für die Antwort. Genau zum Vergleich der Bildsegmentierung. Diese Würfelbewertung wird also verwendet, geben Sie beispielsweise Bild A und Bild B. Bild A ist der wahre Grund (0 oder 1), und Bild B ist meine Segmentierung. Also, was ist die Gesamtzahl der Positiven (1), ist das die Anzahl von 1 in A + die Anzahl von 1 in B? Ich bin hier etwas verwirrt. Gleich wie falsch positiv
RockTheStar
1
@RockTheStar Ich werde meine Antwort bearbeiten, um die Bildsegmentierung zu berücksichtigen.
Gumeo
1
Großartig, vielen Dank für Ihre Erklärung. Noch eine Folgefrage. Was ist mit der Reichweite von D? Liegt das zwischen 0 und 1?
RockTheStar
2
Vielen Dank! Wird dies implementieren und das Ergebnis betrachten
RockTheStar
2
@ Gumeo Sie möchten vielleicht Ihre Antwort korrigieren oder zumindest erklären, siehe meine neue Antwort für Details
dvb
20

Der Würfelkoeffizient (auch als Würfelähnlichkeitsindex bekannt) entspricht dem F1-Wert , entspricht jedoch nicht der Genauigkeit. Der Hauptunterschied könnte die Tatsache sein, dass die Genauigkeit echte Negative berücksichtigt, während der Würfelkoeffizient und viele andere Messgrößen echte Negative nur als uninteressante Standardeinstellungen behandeln (siehe Grundlagen der Klassifikatorbewertung, Teil 1 ).

Soweit ich das beurteilen kann, wird der Würfelkoeffizient nicht wie in einer früheren Antwort beschrieben berechnet , die tatsächlich die Formel für den Jaccard-Index enthält (in der Bildverarbeitung auch als "Schnittpunkt über Vereinigung" bekannt).

Dice(A,B)=2|AB||A|+|B|F1(A,B)=2|A|/|AB|+|B|/|AB|Jaccard(A,B)=|AB||max(A,B)|=|AB||A|+|B||AB|Accuracy(A,B)=|AB|+|A¯B¯||All|

A,BAll|AB|AB|A¯B¯|AB

Der Würfelkoeffizient und der Jaccard-Index sind monoton verwandt, und der Tversky-Index verallgemeinert beide. Weitere Informationen finden Sie unter Ähnlichkeit der F-Scores, Würfel und Jaccard-Sätze .

Der Würfelkoeffizient ist auch das harmonische Mittel der Empfindlichkeit und Präzision. Um zu sehen, warum es sinnvoll ist, lesen Sie Warum ist das F-Maß ein harmonisches Mittel und kein arithmetisches Mittel der Präzisions- und Rückrufmaße? .

Weitere Informationen zu vielen Begriffen in dieser Antwort und ihren Beziehungen finden Sie unter Bewertung von Binärklassifikatoren .

dvb
quelle