Ich habe mich gefragt, da CNNs jede bildbezogene Aufgabe dominiert haben. Wird der Viola-Jones-Gesichtsdetektor immer noch als Stand der Technik angesehen oder haben CNNs seine Leistung übertroffen?
6
Laut dem Artikel Ein Vergleich von CNN-basierten Gesichts- und Kopfdetektoren für Echtzeit-Videoüberwachungsanwendungen CNN-basierte neuronale Netze sind hinsichtlich der Präzision deutlich besser als Viola-Jones, benötigen jedoch mehr Rechenleistung, um die Ergebnisse zu berechnen. Der mittlere durchschnittliche Genauigkeitsfehler für CNN-basierte Netzwerke ist fünfmal geringer als für VJ für FDDB-Daten. Hier ist die Präzisionsvergleichstabelle aus dem Papier:
VJ ermöglicht jedoch eine Echtzeiterkennung mit 60 Bildern pro Sekunde. Hier ist der Geschwindigkeitsvergleich aus demselben Artikel: